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随 着 时 间 的 推移 ,生物 多 样 性 的 重要 性 越 来 越 为 社会 各 界 所 理解 和 重视 。 众 所 周 
知 , 生 物 多 样 性 中 最 为 重要 的 有 物种 多 样 性 .生态 系统 多 样 性 和 遗传 多 样 性 三 个 层次 。 
遗传 多 样 性 是 这 三 个 层次 中 研究 相对 较为 薄弱 的 ,在 我 国 尤其 如 此 。 

遗传 多 样 性 研究 具有 十 分 重要 的 意义 。 其 研究 结果 可 为 物种 濒危 机 制 的 探讨 、 种 质 
资源 的 保存 与 利用 、 生 物 分 类 与 演化 的 研究 .生态 适应 机 制 的 探讨 等 提供 重要 证 据 或 依 
据 。 我 国 的 遗传 多 样 性 研究 取得 了 重要 进展 ,特别 关于 大 熊猫 濒 危机 制 的 研究 受到 国外 
同行 的 关注 。 但 是 , 除 中 国 科 学 院 生物 多 样 性 委员 会 生物 多 样 性 研究 丛书 ”之 一 《中 国 


。 动 植物 遗传 多 样 性 兴 胡 志 昌 和 张 亚 平 主 编 ) 以 外 ,国内 还 没有 遗传 多 样 性 方面 的 专著 出 


版 。 有 鉴于 此 ,我 们 组 织 翻译 了“ 分子 进 化 基础 "中科院 昆明 动物 研究 所 细胞 与 分 子 进 
化 开放 研究 实验 室 陈 建华 译 , 张 亚 平 、 吴 春花 和 李 海 鹏 校 , 其 中 序 和 前 言 由 赵 丽 惠 译 , 马 
克 平 校 ) 和 分子 变异 与 生态 学 问题 (中 科 院 植物 研究 所 魏 伟 译 , 钱 迎 倩 校 ) 以 补充 国内 
这 方面 资料 的 不 足 。 为 了 促进 生物 多 样 性 研究 的 重要 支撑 学 科 之 一 ,生物 系统 学 的 发 
展 , 我 们 将 “生物 系统 学 议程 2000 年 "中科院 动物 研究 所 郭 寅 峰 译 , 中 科 院 植物 研究 所 
钱 迎 倩 和 动物 所 周 红 章 校 ) 同 时 编 入 此 书 , 作 为 《生物 多 样 性 译 丛 》 之 三 正式 出 版 。 其 它 
三 集 分 别 是 :生物 多 样 性 译 丛 一 兴 包 括 《 保 护 世 界 的 生物 多 样 性 》 和 《生物 多 样 性 一 有 


关 的 科学 问题 与 合作 研究 建议 》 两 部 分 )《 全 球 生物 多 样 性 策略 》( 作 为 《 译 丛 》 之 二 ) 和 


《生物 多 样 性 公约 指南 兴 作 为 《 译 丛 》 之 四 )。 我 们 将 继续 选择 国外 本 领域 好 的 资料 翻译 
出 版 ,及 时 把 国外 新 的 理论 、 方 法 和 动态 介绍 到 国内 ,以 推动 中 国 的 生物 多 样 性 保护 和 
朋党 工作 。 

北京 教育 学 院 刘 玉 明 先生 和 中 科 院 植物 所 赵 丽 惠 同 志 认 真 校订 译 稿 ,北京 海岸 文 
化 服务 中 心 刘 万 海 先生 大 力 支持 。 在 此 ,向 他 们 表示 衷心 的 感谢 。 
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1869 年 ，Johann Friedrich Miescher 发 现 了 DNA。 他 曾经 “大 胆 ” 地 认为 ，DNA 可 能 和 遗传 有 
关 。 但 过 了 一 段 时 间 ,， 他 还 是 放弃 了 这 种 “ 荒 订 ” 的 观点 ,并 花费 30 多 年 的 时 间 去 研究 鱼 精 蛋 白 一 
精子 细胞 中 非常 基本 的 蛋白 质 组 分 。 按 照 Miescher 的 观点 ， 这 种 蛋白 质 是 遗传 的 关键 所 在 。 后 来 发 
Bh, DNA 分 子 不 仅仅 是 遗传 的 关键 ,正如 一 位 分 子 进 化 学 先驱 Emile Zuckerkandl 所 说 的 那样 , 它们 
还 是 “进化 史 的 文献 资料 ”。 实 际 上 ， 每 一 种 活 组 织 的 DNA 都 是 历史 过 程 的 积累 。 然 而 ， 包 容 在 这 
些 过 程 里 的 信息 处 在 一 种 杂乱 无 章 的 无 序 状 态 中 ， 是 分 散 的 或 片段 的 。 有 一 些 信息 是 隐藏 的 或 是 
“伪装 ”的 ,很 难 辩 认 出 来 ; 有 一 些 已 丢失 ， 毫 无 踪迹 可 寻 。 分 子 进 化 的 目的 就 是 要 澄清 这 些 历 史 过 
程 ， 整 理 信息 使 之 有 序 ， 读 出 并 解 译 信息 。 

由 于 进化 过 程 难以 用 基因 材料 研究 清楚 ， 用 分 子 资料 不 仅 可 以 重建 进化 年 代 ， 而 且 也 可 以 弄 清 
进化 过 程 的 驱动 力 。 分 子 生 物 学 的 重大 突破 ， 如 基因 克隆 技术 、DNA 序列 分 析 、 限制 性 核酸 内 切 栈 
片段 分 析 等 ， 在 某 种 意义 上 ， 已 使 科学 家 们 处 于 一 种 新 的 十 分 有 利 的 位 置 。 我 们 能 够 洞察 一 个 从 未 
见 过 的 世界 ,在 这 里 ， 基 因 是 通过 复制 、DNA 混 匀 、 核 苷 酸 蔡 代 、 转 移 及 基因 转化 进化 的 。 在 这 个 
世界 里 ， 基 因 组 或 静止 ， 或 流动 ， 有 时 在 过 了 很 长 时 间 后 会 有 微小 的 变化 ， 有 时 又 会 在 媳 眼 间 发 生 
戏剧 性 的 地 质 学 斥 度 的 变化 。 

通过 研究 遗传 材料 ， 我 们 也 能 试 着 将 生物 界 按 系 统 发 育 事实 来 划分 ， 并 建立 分 类 系统 。 与 传统 
的 研究 进化 方法 相反 ， 例 如 比较 解剖 学 、 形 态 学 和 古生物 学 ， 都 毫 无 必要 地 将 自己 限制 在 极端 相似 
组 织 的 进化 关系 研究 中 。 我 们 现在 已 经 能 够 建立 巨大 的 家 系 树 ， 它 连接 兰 椎 动物 、 昆 贝 、 植 物 、 真 
菌 和 细菌 ， 并 能 够 追溯 它们 的 共同 祖先 ， 一 直到 无 法 追溯 的 时 代 。 

本 书 的 宗旨 是 从 分 子 水 平 上 描述 进化 的 原动力 ， 进 化 过 程 的 驱动 力 及 其 基因 组 ， 基 因 和 它们 的 
产物 长 期 进化 的 各 种 分 子 机 制 所 产生 的 结果 。 另 外 ， 本 书 从 进化 观点 为 分 子 材 料 的 比较 和 系统 发 育 
分 析 提 供 了 基本 的 方法 论 。 尽 管 个 体 受 自然 选择 和 其 它 过 程 所 影响 ， 我们 依然 强调 : 是 群体 和 基因 
随 着 进化 时 间 而 变 。 为 了 在 这 些 看 起 来 完全 不 同 的 水 平 间 构造 联系 ， 我 们 借用 了 群体 遗传 学 的 基本 

。 我 们 着 手 为 分 子 进 化 “初学 者 ” 写 了 这 本 书 。 同 时 ， 也 努力 保持 了 方法 的 科学 和 规范 ， 并 包含 
了 一 些 定 量 方法 。 因 此 ， 可 以 用 数学 和 直觉 解释 ， 从 分 子 水 平 上 描述 进化 现象 和 机 制 。 这 两 种 解释 
都 不 会 削弱 彼此 的 说 服 力 ， 还 会 相互 补充 ， 以 帮助 读者 更 好 地 领会 观点 。 我 们 没有 试图 达到 泛泛 的 
完满 性 ， 而 是 提供 了 大 量 实例 ， 以 支持 和 澄清 许多 理论 观点 和 有 争议 的 问题 。 

许多 年 来 ， 生 物化 学 家 和 分 子 生物 学 家 们 把 进化 研究 看 作 是 大 胆 推 测 ， 无 根据 的 假设 和 无 学 科 
方法 论 的 统一 体 ， 而 这 种 评价 从 未 正确 过 。 分 子 方法 的 引进 不 容 置疑 地 将 进化 论 变 成 一 种 “ 硬 ” 科 
学 。 在 这 里 ， 能 够 从 经 验 数据 测度 、 计 数 或 用 计算 机 处 理 相关 的 参数 ， 也 能 用 事实 去 检验 理论 的 正 
确 性 。 在 今天 的 进化 研究 中 ， 推 测 学 也 服务 于 同 物理 学 同样 的 目的 。 它 们 是 定量 性 假说 ， 以 刺激 实 
验 性 工作 。 由 此 ， 理 论 能 够 得 以 校正 、 精 炼 或 被 驱 斥 。 本 书 的 主要 目的 之 一 是 通过 加 强 本 领域 的 事 
实 基础 ,表明 进化 研究 已 经 达到 了 William Herschel 先生 于 1831 年 所 说 的 所 有 自然 科学 的 共同 目的 ， 
即 可 以 这 样 陈 述 其 主张 :“ 不 是 模糊 和 泛泛 的 ， 而 是 在 位 置 、 重 量 和 量度 上 尽 可 能 精确 ”。 

我 们 感谢 许多 同事 、 学 生 和 朋友 ， 是 他 们 帮助 我 们 编辑 了 本 书 。 他 们 的 评论 、 建 议 、 指 正和 讨 
论 大 大 地 提高 了 本 书 的 质量 ， 也 避免 了 许多 。 我 们 荣幸 地 感谢 Sara Barton, Adina Breiman, David 
Cutler, David Hewett-Emmett, Winston Hide, Austin Hughes, Li Jin, Margaret Kidwell, Amanda 
Ko, Giddy Landan, William S. Lewis, Volker Loeschcke, Ora Manheim, David Mindell, Tatsuya ota, 
Lori Sadler, Paul Sharp, Yuval Shuali, Jurgen Tomiuk, Danid Wool 和 Chung-1 Wu. #5!) +h jit ot . HR 
们 感谢 C. William Birky Jr. 和 Bruce walsh, 他 们 两 位 从 头 到 尾 地 校 阅 了 文稿 并 提出 了 很 多 有 益 的 建 

3 . 


lei 博士 表达 感激 之 情 , 他 对 我 们 的 调查 研究 工作 给 予 了 极 大 的 鼓 
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前 言 
什么 是 分 子 进 化 


分 子 进化 包括 两 个 研究 领域 : (1) 大 分 子 进 化 ; (2) 基因 和 有 机 体 进 化 史 的 重建 。 关 于 “大 分 
子 进化 "， 我 们 指 的 是 在 进化 年 代 中 ， 出 现在 遗传 材料 〈 如 DNA 序列 ) 中 的 变化 速率 、 模 式 及 产物 
CME AR) 以 及 与 此 变化 相关 的 机 制 ， 也 被 称 做 分 子 种 系 发 生 史 。 时间 枚 总 覃 分 于 认 化 这 
《正如 从 分 子 材料 所 推 知 的 那样 ) 。 

这 两 个 研究 领域 似乎 由 不 相关 的 研究 项 目 组 成 ， 因 为 第 一 个 研究 领域 的 目的 是 要 盏 明 分 子 进化 
的 原因 和 结果 ; 而 第 二 个 研究 领域 是 仅仅 把 分 子 用 作 工 具 , 以 重建 有 机 体 及 其 遗传 组 分 的 演化 史 。 然 
而 在 实践 中 ， 这 两 个 方面 是 紧密 相关 的 ， 一 个 领域 的 进步 也 会 促进 另 一 领域 的 发 展 ， 例 如 : 种 系 发 


” 生 知 识 对 决定 分 子 特 征 的 变化 顺序 是 很 必要 的 ; 相反 ， 给 定 分 子 的 变化 模式 和 速率 知识 对 试图 重建 


类 和 群 的 进化 史 是 很 重要 的 。 

ESL, 第 三 个 研究 领域 , 前 生物 (Prebiotic) 进化 或 称 “ 生 命 起 源 ” 也 包含 在 分 子 进化 框架 中 。 
然而 ， 它 涉及 到 很 多 猜想 ， 也 极 少 用 到 定量 方法 ， 并 且 ， 在 前 生物 系统 〈 即 缺乏 可 复制 基因 的 系 
统 ) 信息 传递 过 程 的 规律 ， 目 前 还 不 清楚 。 因 此 ， 本 书 并 不 侧重 生命 起 源 ， 有 兴趣 的 读者 可 以 参阅 
Oparin (1957), Cairns-Smith (1982), Dyson (1985) 和 Loomis (1988) 的 著作 。 

分 子 进化 研究 起 源 于 两 个 不 同 的 学 科 : 和 群体 遗传 学 和 分 子 生 物 学 。 群 体 遗 传 学 为 研究 进化 过 程 
提供 了 理论 基础 ， 而 分 子 生物 学 则 为 其 提供 了 经 验 数据 。 因 此 ， 掌 握 群 体 遗 传 学 和 分 子 生 物 学 的 基 
本 知识 对 理解 分 子 进化 是 很 有 神 益 的 。 


Ket 


1 基因 结构 与 突 


本 章 提供 为 研究 DNA 水 平 上 的 进化 过 程 所 必需 的 .关于 分 子 生物 学 方面 的 基础 知识 。 最 为 基本 
的 部 分 是 一 种 典型 的 真 核 生物 基因 的 基因 组 结构 和 各 种 突变 类 型 。 更 进一步 的 背景 知识 将 在 以 后 的 
有 关 章 节 中 讲述 出 。 某 些 术语 请 参看 词汇 表 。 


1.1 DNA 序列 


除 某 些 病毒 外 ,所 有 生物 的 遗传 信息 都 由 脱氧 核糖 核酸 DNA (deoxyribonucleic acid) 分 子 所 扒 
带 。DNA 通常 是 由 两 条 相互 缠绕 的 互补 链 所 组 成 ,形成 一 种 右手 螺旋 状 。 每 条 链 都 是 一 条 由 四 种 核 背 
RAMA ARE RK HR. A PE (purines) : PR ERM A (adenine) fl & RM G(guanine) , Pi FP he 
(pyrimidines) ; fg fit % GE T (thymine) Fil fd he CCcytosine) 。 两 条 链 靠 核 苷 酸 之 间 的 氢 键 联系 在 二 起 。 
腺 味 叭 与 胸腺 喀 啶 通过 两 个 氢 键 ,又 称 弱 键 (weak bond) 配 对 ;而 鸟 味 叭 与 胞 旷 啶 通过 三 个 氢 键 ,又 称 
强 键 Cstrong bond) 配 对 (图 1 一 1)。 
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图 1 一 1 Sahm He Boe Cy Bl A i oR) Be AT, Ca) A Ae AR HR Fo ARR SZ ie (25 BE) , fo Cb) AE LER Fo B 
之 间 ( 强 键 )。P :磷酸 根 ;S : 糖 。 

DNA 序列 中 的 每 一 个 核 苷 酸 都 包含 一 个 成 糖 ( 脱 氧 核糖 )、 一 个 磷酸 基 团 和 一 个 味 叭 或 喀 喧 碱 
基 。DNA 分 子 的 主干 由 糖 和 磷酸 等 部 分 构成 ,它们 通过 不 对 称 的 5 一 3' 磷 酸 二 酯 键 共 价 连结 在 一 起 。 
所 以 ;DNA 分 子 是 一 种 有 极 性 的 分 子 , 它 的 一 端 ,在 末端 核 苷 酸 的 5' 碳 原子 上 有 一 个 磷酸 根 ( 一 P)， 
另 一 端 ,其 末端 核 苷 酸 的 3 碳 原 子 上 有 一 个 游离 羟基 (一 OH) .磷酸 二 酯 键 的 方向 决定 着 分 子 的 特性 ; 

。6。 


例如 ,序列 5 一 G 一 C 一 A 一 A 一 工 一 3 与 序列 3' 一 G 一 C 一 A 一 A 一 工 一 5 是 两 种 不 同 的 序列 。 为 了 方 
便 起 见 ;DNA 序列 按 其 转录 的 顺序 , 即 从 5' 端 到 3' 端 书写 ,它们 又 分 别 被 称 为 上 游 (upstream) 和 下 游 
(downstream) 方 向 。DNA 的 双 螺 旋 形 式 有 两 条 链 , 按 反 辕 平行 方向 排列 着 (图 1 一 2)。 


5’ P+dk-—P—dk—P—dR-~P die OM 3 
bs rif ew etme 
C T T G 

3’ RA RS St ee ve 


图 1 一 2 双 链 DNA 的 反 向 平行 结构 的 图 示 
P, 磷 酸根;dR ,脱氧 核糖 ;CH, 凑 基 ;A, 腺 味 叭 ;G, 鸟 味 叭 ;C, 胞 喀 啶 ; 工 ,胸腺 喀 喧 ;一 , 共 价 键 ;.，，。, 弱 键 ;…, 强 键 。 
核糖 核酸 RNA(ribonucleic acid) 既 有 双 链 分 子 又 有 单 链 分 子 。RNA 与 DNA 不 同 之 处 在 于 ,其 主 
王 糖 的 部 分 是 核糖 而 不 是 脱氧 核糖 ,由 尿 喀 啶 核 苷 酸 代 替 了 胸腺 喀 啶 核 苷 酸 。 腺 味 叭 , 胞 喀 啶 , 鸟 嘲 
叭 ,以 及 胸腺 喀 啶 / 尿 喀 啶 ,都 是 标准 核 苷 酸 。 某 些 功能 RNA 分 子 , 特 别 是 tRNA 分 子 , 常 含有 非 标 准 
核 苷 酸 , 即 在 转录 之 后 导入 RNA 分 子 中 的 、 将 标准 核 苷 酸 加 以 化 学 修饰 的 核 苷 酸 。 


1.2 基因 结构 


过 去 ,基因 被 定义 成 为 一 个 多 肽 链 编码 或 确定 一 个 功能 RNA 分 子 的 一 个 DNA 片段 。 然 而 ,最 近 
的 分 子 研 究 却 从 根本 上 改变 了 我 们 对 基因 的 认识 ,所 以 ,我 们 将 采用 一 个 更 有 点 生气 的 定义 , 即 基因 
是 对 某 一 特殊 功能 至 关 重 要 的 基因 组 DNA 或 RNA 的 一 个 序列 。 执行 这 一 功能 可 能 并 不 需要 该 基因 
被 翻译 出 来 ,甚至 无 需 被 转录 出 来 。 

现在 ,已 有 三 类 基因 被 认识 :(1) 为 蛋白 质 编码 的 基因 (protein-coding genes) ,它们 在 被 转录 成 
RNA 之 后 再 被 翻译 成 蛋白 质 ;(2)RNA 基因 (RNA-specifying genes) ,它们 仅 被 转录 ;(3) 调 节 基 因 
(regulatory genes) 。 按 照 狭 义 的 定义 ,第 三 类 只 包括 那些 不 转录 的 序列 。 被 转录 的 调节 基因 本 质 上 属 
于 前 两 类 之 一 。 和 蛋白 质 编码 基因 和 RNA 基因 又 被 看 成 是 结构 基因 (structural genes), 注意 , 某 些 作者 
将 结构 基因 的 定义 ,限制 在 只 包括 蛋白 质 编码 基因 的 范围 。 

在 细菌 中 ,结构 基因 的 转录 仅 由 一 种 依赖 DNA 的 RNA 多 聚 酶 执行 。 与 之 不 同 的 是 ,在 真 核 生 物 
里 要 用 到 三 种 RNA 多 聚 酶 。 核 糖 体 RNACrRNA) 基 因由 RNA 多 聚 酶 工 转录 ,蛋白质 编码 基因 由 
RNA 多 聚 酶 工 转录 ,小 分 子 细胞 质 RNA(CscRNA) 基 因 , 象 转 移 RNA(CtRNA) 的 基因 , 则 由 RNA 2B 
酶 开 转 录 ， 某 些小 分 子 细胞 核 RNA(snRNA) 基 因由 多 聚 酶 工 转 录 , 另 一 些 则 由 多 聚 酶 下 转录 。 一 种 
snRNA 基因 Us ,可 能 既 被 多 聚 酶 工 又 被 多 聚 酶 下 转录 。 


蛋 和 白质 编码 基因 


真 核 生 物 的 一 个 标准 的 蛋白 质 编码 基因 由 转录 部 分 和 不 转录 部 分 构成 (图 1 一 3a)。 不 转录 部 分 
根据 它们 相对 于 蛋白 质 编码 基因 的 位 置 ,被 命名 为 5 和 3' 侧 序列 (flanking sequences) , 5! fill FF A&A 
LES RFA) ,它们 决定 转录 过 程 的 起 始 、 缓 急 和 终止 。 因 为 这 些 调节 序列 起 始 转录 过 程 , 所 
以 ,它们 也 被 称 为 启动 子 (promoters) ,而 它们 所 处 的 部 位 则 叫 启动 子 区 (promoter region)。 启 动 子 区 
由 以 下 信号 构成 :TATA 块 (TATA box) ,位 于 转录 起 始点 上 游 19 一 27 碱 基 对 (bp) 处 ,更 上 游 一 些 的 
CAAT (CAAT box) ,以 及 一 个 或 多 个 GC 块 (GC box) 拷 贝 , 后 者 由 序列 GGGCGG 或 其 变异 体 组 
成 ,位 于 CAAT 块 的 周围 (图 3a) 。 可 能 在 定向 方面 起 作用 的 CAAT 块 和 GC 块 , 控 制 RNA 多 聚 酶 的 
起 始 联结 ,而 TATA 块 则 控制 转录 起 始点 的 选取 。 不 过 ,我 们 注意 到 ,以 上 信号 对 启动 子 的 功能 而 言 
都 不 是 必 不 可 少 的 。 某 些 基 因 不 具有 TATA 块 ,所 以 没有 一 种 独一无二 的 转录 起 始点 . 另 一 些 基 因 婚 
没有 CAAT 块 也 没有 GC 块 ,它们 的 转录 起 始 是 受 5' 侧 区 域 中 的 其 他 因素 所 控制 的 .3' 侧 序列 含有 关 
于 转录 过 程 终止 的 信号 和 多 聚 腺 苷 酸 尾部 的 信和 号。 目前 ,还 不 能 精确 地 标明 三 个 基因 开始 和 终止 的 位 


en? 


点 。 

真 核 生物 中 为 蛋白 质 编码 的 基因 的 转录 起 始 于 转录 起 始 部 位 (transcription-initiation site) (RNA 
转录 物 中 的 帽子 部 位 (cap site)) ,结束 于 终止 部 位 (termination site), 后 者 与 成 熟 信 使 RNACmRNA) 
分 子 的 多 聚 腺 苷 化 作用 (polyadenylation) 或 多 聚 腺 苷 酸 尾 部 位 (poly(A)-addition site) 可 能 等 同 , 也 可 
能 不 等 同 。 换 言 之 ,转录 的 终止 可 能 发 生 在 比 多 聚 腺 苷 酸 尾部 更 下 游 的 地 方 。 转 录 而 成 的 RNA, 又 称 
前 信使 RNA(pre-messenger RNA)(pre-mRNA) 包 含 5 和 3' 不 翻译 区 ,Cuntranslated regions) ,外 显 子 
(exons) 和 内 含 子 (introns) 。 内 含 子 ,或 插 和 人 序列 ,是 一 些 虽 被 转录 但 在 前 mRNA 分 子 的 加 工 中 被 剪 
除 的 序列 。 所 有 保留 在 经 拼接 而 达成 熟 的 mRNA 中 的 基因 组 序列 称 外 显 子 。 oe 
外 显 子 的 某 些 部 分 称 为 蛋白 质 编码 的 外 显 子 或 编码 区 (coding regions) 。 

有 几 种 类 型 的 内 含 子 , 按 它们 从 前 mRNA 中 剪除 的 特异 机 制 来 界定 其 性 质 ( 见 Lewin,1990)。 这 
里 我 们 只 关心 那些 受 RNA 多 聚 酶 工 转 录 的 细胞 核 基因 中 的 内 含 子 。 这 些 内 含 子 在 分 子 成 熟 期 间 ,在 
酶 促 作 用 下 从 前 mRNA 中 剪除 。 这 些 内 含 子 的 拼接 位 点 (splicing sites or junctions) 可 能 由 每 三 内 含 
子 的 5 和 3' 端 上 的 核 苷 酸 来 决定 ,分 别称 给 体 (donor) 和 受 体 (acceptor) 部 位 。 例 如 ,所 有 真 核 生 物 的 
细胞 核 内 含 子 都 以 GT 开始 ,以 AG 结束 (GT 一 AG 规则 (GT-AG rule)) ,而 已 表明 这 些 序列 对 于 正 
确 的 剪 切 和 拼接 是 至 关 重 要 的 (图 1 一 3a)。 和 邻近 内 含 子 的 外 显 子 序列 可 能 对 拼接 部 位 的 决定 也 有 贡 
献 。 此 外 ,每 一 内 含 子 都 含有 一 段 特别 的 序列 ,TACTAAC 框 (TACTAAC box) ,位 于 内 含 子 3/ 端 上 游 


侧 序列 区 外 显 子 2 外 显 子 3 。 侧 序列 区 
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图 1 一 3 (《a) 典 型 真 核 生 物 的 蛋白 质 编码 基 因 的 图 示 结 构 。 注 意 , 按 照 习惯 5/ 端 放 在 左边 . (b) 受 诱导 的 原核 生物 的 
操纵 子 的 图 示 结 构 。 基 因 A 和 也 是 为 蛋白 质 编码 的 基因 ,并 被 转录 形成 一 个 信使 RNA。 阻 遇 物 基因 为 二 个 阳台 县 
白 编码 ,后 者 结合 在 操纵 基因 上 ,并 通过 过 制 RNA 多 聚 酶 的 移动 从 而 阻碍 结构 基因 的 转录 。 操 纵 基因 是 二 段 至 风 
有 10 个 碱 基 长 的 DNA 区 域 , 它 可 能 与 操纵 子 中 基因 的 被 转录 区 域 重 重 。 经 与 一 种 诱导 物 (二 种 小 分 子 ) 结 大 后 ,天 
坎 物 转化 成 一 种 不 能 与 操纵 基因 结合 的 形式 。 于 是 RNA 多 聚 酶 就 能 起 动 操纵 子 中 基因 A fo BMH RL Lewin 
1990)。(a 和 (b) 两 图 中 的 各 区 都 不 是 按 其 尺度 来 画 的 . 
约 30 个 碱 基 的 地 方 。 这 一 序列 在 酵母 细胞 核 基 因 中 是 相当 保守 的 ,而 它 在 更 高 等 的 真 核 生 物 的 基因 
申 则 要 变化 得 多 样 一 些 。 拼接 过 程 包括 5 拼接 部 位 的 裂 开 ,以 及 内 含 子 5 端 的 G 和 TACTAAC 框 中 
第 6 位 上 的 A 之 间 形 成 克 酸 二 酯 键 。 随 后 ,3' 拼 接 部 位 裂 开 , 而 两 个 外 显 子 则 被 连 在 二 起， 
内 含 子 的 数目 因 基因 而 异 。 某 些 基因 具有 十 几 个 内 含 子 , 其 中 有 些 内 含 子 可 能 有 几 千 个 核 昔 酸 
长 。 另 三 些 ( 例 如 ,大 多 数组 蛋白 基因 ) 则 完全 没有 内 含 子 。 外 显 子 在 整个 基因 中 并 不 是 均匀 分 布 的 
。8 。 


有 些 外 显 子 密 集 在 一 起 ,另外 一 些 则 位 于 与 邻近 外 显 子 相距 很 远 的 地 方 。 图 1 一 4 给 出 了 说 明 这 一 现 
象 的 一 个 例子 。 注意 ,细胞 核 蛋 白质 编码 基因 的 绝 大 多 数 具 有 内 含 子 。 并 非 所 有 内 含 子 都 起 分 裂 编码 
区 的 作用 。 有 些 内 含 子 出 现在 不 翻译 区 域 ,主要 在 转录 -起 始 位 点 和 起 始 密码 子 之 间 的 区 域 中 。 

真 细菌 类 的 蛋白 质 编 码 基因 与 真 核 生 物 中 的 这 类 基因 有 几 方 面 不 同 , 最 重要 的 是 ,它们 不 含 内 含 
F (图 1 一 3b)。 真 细菌 中 的 启动 子 含 有 一 个 一 10 序列 (一 10 sequence) 和 一 个 一 35 序列 (一 35 se- 
quence) ,分 别 位 于 转录 起 始 位 点 上 游 10bp 和 35bp 的 地 方 . 前 者 也 称 普 里 伯劳 块 (Pribnow box) RA 
序列 TATAAT 或 其 变异 形式 ,而 后 者 则 具有 序列 TTGACA 或 其 变异 形式 。 原 核 生 物 的 启动 子 在 离 
一 35 序列 更 上 游 的 地 方 , 可 能 还 含有 其 他 一 些 特别 的 序列 。 

原核 生物 中 几 个 结构 基因 可 能 呈 连 续 排 列 以 形成 一 个 基因 表达 单位 , 它 被 转录 成 一 个 mRNA 分 
子 ,接着 再 翻译 成 不 同 的 蛋白 质 。 这 种 单位 通常 都 含有 控制 属于 该 单位 的 基因 协调 地 表达 的 遗传 因 
素 。 这 一 由 基因 排列 成 的 整体 称 为 一 个 操纵 子 (operon) (图 1 一 3b) 。 


RNA 基因 


原核 生物 和 真 核 生 物 中 的 RNA 基因 ,其 结构 通常 是 相似 的 。 这些 基因 一 般 不 含 内 含 子 。 然 而 ,在 
有 些 生 物 中 , 象 纤 毛虫 、 粘 菌 和 细菌 中 ,确定 RNA 的 基因 就 可 能 含有 在 RNA 变 成 有 功能 分 子 前 必须 
被 剪除 的 内 含 子 。 涉 及 某 些 RNA 基因 的 转录 调节 的 序列 因素 ,有 时 被 包括 在 决定 功能 终 产物 的 序列 
的 范畴 内 。 特 别 地 ,所 有 确定 tRNA 的 基因 都 含有 一 个 受 RNA 多 聚 酶 下 识别 的 内 部 转录 起 始点 。 

许多 RNA 分 子 在 转录 之 后 都 受到 修饰 。 这 类 修饰 包括 标准 和 非 标准 核 苷 酸 的 挫 人 ,标准 核 苷 酸 
转变 成 非 标准 核 苷 酸 的 修饰 ,向 5 或 3 末端 的 核糖 核 苷 酸 的 终端 序列 的 酶 促 添 加 等 。 


图 1 一 4 人 的 区 因子 基因 中 8 个 外 显 子 的 位 置 .图 中 坚 线 代 表 8 个 外 显 子 .本 图 只 标 出 了 被 转录 的 区 域 , 外 显 子 和 
内 含 子 均 按 其 尺度 绘 出 。 注 意 ,5' 不 翻译 区 比 3' 不 翻译 区 短 。 资 料 取 自 Yoshitake 等 (1985) 。 


调节 基因 


我 们 对 调节 基因 的 认识 比 对 其 他 类 型 基因 的 认识 要 晚 一 些 。 暂 时 只 有 几 种 这 类 基因 或 基因 家 族 
被 鉴别 出 来 。 它 们 是 ;(1) 复 制 子 基因 (replicator genes) ,作为 DNA 复制 的 起 始 和 终止 的 特异 位 点 而 
起 作用 ,(2) 重 组 子 基因 (recombinator genes) ,提供 受 与 重组 有 关 的 酶 识别 的 特异 位 点 ,(3) 分 离子 基 
因 (segregator genes) ,在 有 丝 分 裂 和 减 数 分 裂 期 间 ,提供 将 染色 体 附 着 到 分 离 机 构 上 的 特异 位 点 ,以 
及 (4) 附 着 位 点 (attachment sites) ,为 蛋白 质 、 激 素 , 或 其 他 分 子 所 附着 。 可 能 还 存在 更 多 的 调节 基因 ， 
它们 中 有 些 可 能 在 功能 和 位 置 两 方面 都 是 独立 于 结构 基因 的 ,并 且 可 能 与 更 复杂 的 调节 功能 , 象 多 细 
胞 生物 的 个 体 发 育 有 关 。 


1.3 遗传 密码 


蛋白 质 合 成 涉及 到 一 个 解码 过 程 , 厌 此 ,一 个 由 mRNA 分 子 携带 的 遗传 信息 通过 转移 RNA (tR- 

NA) 介 体 的 使 用 ,而 被 翻译 成 氨基 酸 。20 种 基本 氮 基 酸 及 其 缩写 形式 列 于 表 1 一 1。 翻 译 从 翻译 起 始 

位 点 开始 ,进行 到 一 个 终止 信号 时 为 止 。 翻 译 过 程 涉 及 相互 邻近 的 不 重 登 核 苷 酸 三 联 体 , 称 为 密码 子 

《codons) 的 连续 识别 。 一 个 将 被 翻译 的 序列 的 相位 由 起 始 密码 子 决定 , 称 为 阅读 框架 (reading frame) 。 

在 处 于 核糖 体 和 mRNA 分 子 间 的 中 间 相 位 的 翻译 机 构 中 ,每 一 个 密码 子 被 翻译 成 一 个 特异 氨基 酸 ， 

它 被 连续 地 添加 到 正在 延长 的 多 肽 链 上 。 密 码 子 与 氨基 酸 之 间 的 对 应 由 一 组 称 为 遗传 密码 (genetic 
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code) 的 规则 来 决定 。 除 了 几 个 例外 情况 ( 见 后 面 ) ,与 细胞 核 为 蛋白 质 编码 基因 有 关 的 遗传 密码 是 “ 通 
FAAS” Cuniversal) , 即 几 乎 所 有 真 核 生 物 的 细胞 核 基因 和 原核 生物 的 基因 的 翻译 ,都 是 由 同一 组 规则 
所 决定 的 。 

通用 密码 子 由 表 1 一 2 给 出 。 由 于 1 个 密码 子 由 3 个 核 童 酸 组 成 , 且 存在 四 种 不 同类 型 的 核 苷 酸 ， 
所 以 ,应 有 4: 一 64 种 可 能 的 密码 子 。 其 中 61 个 为 特异 的 氨基 酸 编码 ,并 被 称 为 有 意义 密码 子 (sense 
codons) ,其 余 3 个 则 为 无 意义 密码 子 或 终止 密码 子 (nonsense or stop codons) ,其 作用 是 充当 使 翻译 过 
程 终止 的 信号 。 因 为 有 意义 密码 子 有 61 个 ,而 蛋白 质 中 的 氨基 酸 却 上 只 有 20 种 ,所 以 ,大 多 数 氨基 酸 由 
1 个 以 上 的 密码 子 编码 。 这 样 一 类 密码 被 称 为 是 简 并 密码 (degenerate code) 。 编 码 同 一 氨基 酸 的 不 同 
密码 子 称 同 义 密码 子 (synonymous codons), 。 相 互 之 间 仅 在 第 3 位 上 不 同 的 同 义 密码 子 被 指定 为 一 个 
密码 子 族 (codon family) 。 例 如 ,为 顷 氮 酸 编码 的 4 个 密码 子 组 成 一 个 四 密码 子 族 。 与 之 对 比 ,为 丝 氢 
酸 编码 的 6 个 密码 子 被 分 成 一 个 四 密码 子 族 和 一 个 二 密码 子 族 。 

表 1 一 1 基本 和 氨基酸 及 其 三 字母 和 一 字母 缩写 


名 = i ‘ 三 字母 缩写 一 字母 缩写 
Alanine Ala A 
”Arginine Arg R 
Asparagine Asn N 
Aspartic acid Asp D 
Cysteine Cys C 
Glutamic Acid Glu E 
Glutamine Gln Q 
Glycine Gly G 
Histidine His H 
Isoleucine Tle I 
Leucine Leu Le 
Lysine Lys K 
Methionine Met M 
Phenylalanine Phe F 
Proline Pro P 
Serine Ser S 
- Threonine Thr ify 
Tryptophan Trp WwW 
Tyrosine Tyr Y 
Valine Val V 


表 1 一 2 通用 密码 子 
密码 子 氨基 酸 mT 氨基 酸 RAT 氨基 酸 密码 子 氨基 酸 


UUU Phe UCU Ser UAU Tyr UGU Cys 
UUC Phe UCC Ser UAC Tyr UGC Cys 
UUA Leu UCA Ser UAA Stop UGA Stop 
UUG Leu UCG Ser UAG Stop UGG Trp 
CUU Leu CCU Pro CAU His CGU Arg 
CUC Leu CCC Pro CAC His CGC Arg 
CUA Leu CCA Pro CAA Gln CGA Arg 
CUG Leu CCG Pro CAG Gln CGG Arg 
AUU Tle ACU Thr AAU Asn AGU Ser 
AUC lle ACC Thr AAC Asn AGC Ser 
AUA Ile ACA Thr AAA Lys AGA Arg 
AUG Met ACG Thr AAG Lys AGG Arg 
GUU Val GCU Ala GAU Asp GGU Gly 
GUC Val GCC Ala GAC Asp GGC Gly 
GUA Val GCA Ala GAA Glu GGA Gly 
GUG Val GCG Ala GAG Glu GGG Gly 
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大 多 数 真 核 生 物 的 蛋白 质 中 第 1 个 氨基 酸 是 甲 硫 氨 酸 ,由 起 始 密码 子 (initiation codon) AUG 编 

码 。 这 一 氨基 酸 在 成 熟 蛋白 质 中 通常 被 移 除 了 。 大 多 数 原 核 生 物 的 基因 也 用 AUG 密码 子 作 为 起 始 ， 
起 始 翻译 过 程 的 氨基 酸 则 是 甲 硫 氨 酸 的 衍生 物 , 称 甲 酰 甲 硫 氮 酸 。 
表 1 一 3 哺乳 动物 线粒体 的 密码 子 ” 


密码 子 AER FAT 氨基 酸 密码 子 AER RBS 氨基 酸 


UUU Phe UCU Ser UAU Tyr UGU Cys 
UUC Phe UCC Ser UAC Tyr UGC Cys 
UUA Leu UCA Ser UAA Stop UGA Trp 
UUG Leu UCG Ser UAG Stop UGG Trp 
CUU Leu coy Pro CAU His CGU Arg 
CUC Leu CCC Pro CAC His CGC Arg 
CUA Leu CCA Pro CAA Gln CGA Arg 
CUG Leu CCG Pro CAG Gln CGG Arg 
AUU . Tle ACU Thr AAU Asn AGU Ser 
AUC Tle ACC Thr AAC Asn AGC Ser 
AUA Met ACA Thr AAA Lys AGA Stop 
AUG Met, ACG Thr AAG Lys AGG Stop 
GUU Val GCU Ala GAU Asp GGU Gly 
GUC Val GCC Ala GAC Asp GGC Gly 
GUA Val GCA Ala GAA Glu GGA Gly 
GUG Val GCG Ala GAG Glu GGG Gly 


< 与 通用 密码 子 的 差别 用 黑体 字 表示 。 
通用 密码 子 在 质 体 一 象 维 管 植物 的 叶绿体 一 基因 组 所 采用 的 独立 的 翻译 过 程 中 也 被 使 用 着 。 比 
较 起 来 ,大 多 数 线粒体 基因 组 和 几 种 细胞 核 基因 组 (例如 , 枝 原 体 属 Mycozplasma 和 四 膜 虫 属 Terrahny- 
men&) 则 使 用 与 通用 密码 子 不 同 的 密码 子 。 不 过 ,一 般 说 来 这 些 密码 子 与 通用 密码 子 之 间 只 有 较 小 的 
差别 。 作 为 一 例 ,哺乳 动物 线粒体 的 密码 子 列 于 表 1 一 3。 注 意 , 通 用 遗传 密码 中 编码 丝氨酸 的 密码 子 
有 两 个 被 用 作 终 止 密码 子 ,而 色 氮 酸 和 甲 硫 氨 酸 都 是 被 两 个 密码 子 编码 ,而 不 是 一 个 。 


DNA 序列 在 染色 体 复制 过 程 中 ,正常 情况 下 被 精确 地 拷贝 。 然 而 , 极 偶然 地 也 会 出 现 错误 ,从 而 
产生 新 的 序列 。 这 些 错误 称 之 为 突变 (mutations) 。 突 变 既 可 发 生 在 体 细胞 内 又 可 发 生 在 种 系 细胞 内 。 
由 于 体 细胞 突变 是 不 遗传 的 ,所 以 ,在 只 讨论 进化 问题 时 我 们 将 不 考虑 它们 。 本 书 通 篇 提 及 的 “突变 ” 
这 个 词 ,将 只 指 在 种 系 细胞 中 的 突变 。 

突变 可 以 根据 受 突变 事件 影响 的 DNA 序列 的 长 短 来 分 类 。 例 如 ,突变 可 能 影响 到 一 个 核 苷 酸 
〈 点 突变 (point mnutations) ) 或 几 个 相互 邻近 的 核 苷 酸 。 我 们 也 可 按 突变 事件 造成 的 变化 类 型 ,将 突变 
分 成 :(1) 替 换 (substitutions), 即 一 个 核 苷 酸 被 另 一 个 所 取代 ,(2) 缺 失 (deletions)， 即 从 DNA 中 移 去 
一 个 或 多 个 核 苷 酸 ,(3) 插 入 (insertions) ,向 序列 中 添加 一 个 或 多 个 核 苷 酸 ,(4) 倒 位 (inversions) , 即 含 
有 2 个 或 多 个 碱 基 对 的 双 链 DNA 片段 转动 180"( 图 1 一 5)。 


核 背 酸 蔡 换 


核 苷 酸 替 换 分 成 转换 (transition il Mi # (transversions) Wi *. HRA A M GCM) = jaja T AIC 
CHE ME) Z NA) A ER. HR — SR SF — Ea A HH. 
发 生 在 蛋白 质 编 码 区 的 核 苷 酸 蔡 换 也 可 通过 它们 对 翻译 产物 恒 白 质 的 影响 来 定性 。 如 果 替 换 不 
引起 氨基 酸 改 变 ( 图 1 一 6a) , 则 被 称 为 是 同 义 的 (synonymous) 或 沉默 的 (silent) 。 非 同 义 的 或 引起 氢 
基 酸 改变 的 突变 ,又 可 进一步 攻 划 分 成 总 又 的 (missensey 和 无 义 的 (nonsense) 突 变 。 谋 又 实 变 将 受到 
国王 


(a) 


”bb) 


图 1 一 5 突变 的 类 型 


〈a) 原 序列 ;(b) 从 C 到 工 的 转换 ;(c) 从 G 到 C 的 颠 换 ;(d) 缺 失 序 列 ACCTA;(e) 插 人 序列 AAAGC; (5 -GCAAAC— 3! 倒 


fi Re 5’ — CAAACG— 3’, 


影响 的 密码 子 变 成 另 一 种 密码 子 , 后 者 确定 的 氨基 酸 与 前 者 编码 的 氨基 酸 互 不 相同 (图 1 — 6b). HM 
突变 则 将 密码 子 变 成 一 个 终止 密码 子 ,这样 , 由 于 翻译 过 程 在 成 熟 前 就 结束 了 ,所 以 最 终结 果 是 产生 
一 个 截 掉 尾巴 的 蛋白 质 ( 图 1 一 6C) 。 


(b) He Cys 


AAGGCAAACCTACTGGTCTTATGT 


x 
AAGGCAAATCTACTGGTCTTATGT 


= 
AAGGCAAACCTACTGCTCTTATGT 


AAGGCAACTGGTCTTATGT 


ACCTA 


AAGGCAAACCTACTAAAGCGGTCTTATGT 


AAGGTTTGCCTACTGGTCTTATGT 


ATA 


ATA 


ATA 


ATA 


ATA 


ATA 


图 1 一 6 发 生 在 编码 区 中 的 替换 类 型 
(a) 同 义 的 ,(b) 误 义 的 ,和 (c) 无 义 的 。 


每 一 个 有 意义 密码 子 通过 一 次 核 苷 酸 替 换 可 以 突变 成 9 种 其 他 密码 子 ， 例 如 ,CCU(pro) 可 以 经 
历 6 种 非 同 义 的 替换 , 变 成 UCU (Ser), ACU (Thr),GCU (Ala),CUU (Leu) , CAU (His) # CGC 
(Arg), WA 3 种 同 义 的 替换 , 变 成 CCC,CCA 或 CCG。 因 为 通用 遗传 密码 由 61 个 有 意义 密码 子 组 
成 ,所 以 有 61X9=549 种 可 能 的 核 苷 酸 蔡 换 。 如 果 我 们 假定 核 苷 酸 替 换 随 机 地 进行 且 编 码 区 中 所 有 
密码 子 具 相同 的 频率 ,那么 ,我 们 就 能 根据 遗传 密码 算出 不 同类 型 核 苷 酸 蔡 换 的 期 望 比 例 .， 这些 数 据 
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Ala 


GCA AAC GIC CIG 


GCAAACGTCCTGTTAACA 


Asn 


Val 
GTC 


GTA 


Val 


Val 


GTC 


TGC 


Phe 


Val 


Leu 


Thr 
ACA 


ACA 
Thr 


Thr 
ACA 
ACA 


Thr 


Thr 
ACA 


列 于 表 1 一 4。 由 于 遗传 密码 的 结构 , 同 义 替 换 主要 发 生 在 密码 子 的 第 3 位 上 。 事 实 上 ,第 3 位 上 所 有 
可 能 发 生 的 改变 中 ,大 约 70%% 是 同 义 的 。 相 比 之 下 ,密码 子 第 2 位 上 的 所 有 蔡 换 都 是 非 同 义 的 ,而 第 1 
位 上 发 生 的 核 苷 酸 变化 , 绝 大 多 数 也 是 如 此 (96%% )。 


表 1 一 4 随机 蛋白 质 编 码 序 列 中 不 同类 型 突变 替换 的 相对 频率 


替换 数目 百分比 
全 部 密码 子 总 数 549 100 
同 义 的 134 25 
非 同 义 的 415 75 
误 义 392 71 
KEM 23 4 
第 一 位 总 数 183 100 
同 义 的 8 4 
非 同 义 的 175 96 
误 义 166 91 
无 意义 9 5 
第 二 位 总 数 183 100 
同 义 的 0 0 
非 同 义 的 183 100 
误 义 176 96 
LBM 7 4 
第 三 位 总 数 183 100 
同 义 的 126 69 
非 同 义 的 57 31 
误 义 50 27 
无 意义 7 4 
缺失 
一 一 一 
4 一 一 = a5 
a — eS 
添加 


图 1 一 7 不 等 价 交 换 , 结 果 是 子 链 之 一 中 某 一 DNA 序列 缺失 ,而 另 一 子 链 中 则 出 现 同一 序列 的 重复 。 图 中 先 形 表 
示 某 一 特定 长 度 的 DNA。 


缺失 和 插入 
缺失 和 揪 和 人 可 能 由 几 种 机 制造 成 。 机制 之 一 是 不 等 价 交 换 (unequal crossing over)。 图 1 一 7 绘 出 


了 _ 1 殴 单 模型 ERR EET FRR CAR LIE — DNA 片段 缺失 ,而 
在 另 一 条 上 则 出 现 相 应 的 添加 。 另 一 个 机 制 是 复制 滑脱 (replication slippage) 或 滑脱 链 误 配 (slipped- 
strand mispairing) 。 这 类 事件 发 生 在 含有 邻接 短 重复 序列 的 DNA 区 域 中 。 图 1 一 8a 表示 ,在 DNA 复 
制 期 间 ,滑脱 可 因 邻 接 重复 间 的 误 配 而 引起 ,而 滑脱 又 可 造成 某 一 DNA HERA RES MR. 
于 究竟 是 缺失 还 是 重复 , 则 要 看 滑脱 发 生 在 5"~3' 方 向 还 是 与 之 相反 的 方向 。 图 1 一 8b 表明 ,滑脱 误 
配 也 可 能 发 生 在 非 复 制 DNA 中 。 造成 DNA 序列 插入 或 缺失 的 第 三 种 机 制 是 DNA 转 座 ,这 将 在 第 7 
章 中 加 以 探讨 。 

SRS AULA SEAS BEE (ges) 因为 当 一 个 带 有 缺失 或 插入 的 序列 与 原 序列 比较 时 ,两 序列 中 就 将 
有 一 个 会 出 现 “ 裂 锋 ”( 第 3 章 )。 裂 颖 事件 中 涉及 的 核 苷 酸 数目 ,范围 从 一 个 或 几 个 到 包括 成 千 个 核 昔 
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(a) 在 DNA 复制 期 间 正常 配对 四 相互 作用 巢 色 体 DNA 的 正常 配对 


5’—AATCCTAGTATATA 3’ 
nwt Ss siseeceace 5’—AATCCTAGTATATACACGAATT—3° 
4'—TTAGGATCATATATGTGCTTAA—S’ - SP2SSTS See eeese caer 
<~TTAGGATCATATATCTGCEE AE 地 
滑脱 链 误 配 ， 滑 脱 链 误 本 滑脱 链 误 配 
AG AG 
T 
A rs 
5 一 AATC TATA Le 5’ AATCCTAGTATATA 4 [ 
tit eens icp tes 5 AATE 人 
3’—TTAGGATCATAT TATGTGCTTAA—S’ 3'—TTAG ATATGTGCTTAA 一 一 5 32322333 
G 中 5 一 TTAccATcATAT ， TTAA 一 -一 5 
A A Cc 
TE 
GT 
复制 继续 插入 TA 重复 单位 不 配对 的 TA 重复 
单位 被 切除 后 继续 复制 - 切除 /修复 
| MA TA 重复 单位 
AG 
Hy I AG 
GonA.  « «=e 加 
5 oe TATATACACGAATT—3" 5 一 AATCCTAGTATACACGAATT —3 Crit | a ee 
生生 下 这 证 下 下 让 人- 和 你 于 和 明生 吕 生 放 计 5 一 AATC 让 
IE 3 TTAC ATATGTGCTTAA 一 一 5 2 
Boe 3‘—TTAGGATCATATATGTGCTTAA—S’ 


Tc 


图 1 一 8 BREMOSR PA (FHUARAR) MOAR AEH ER FRA, DRAFT DNA 合成 的 方向 ， 
圆 点 表示 碱 基 配 对 。(a) 在 DNA 复制 期 间 TA 重复 中 发 生 的 两 碱 基 滑 脱 。3' 一 5' 方 向 中 的 滑脱 造成 一 个 TA 单位 播 
入 的 结果 ( 左 半 图 )。 另 一 方向 中 的 滑脱 则 造成 一 个 重复 单位 缺失 的 结果 ( 右 半 图 )。 右 半 图 中 的 缺失 是 正在 生长 的 
链 的 3' 端 上 ,未 配对 重复 单位 ( 标 有 星 号 ) 被 切除 而 造成 的 ,推测 系 赁 借 DNA 聚合 酶 的 3 一 5' 外 切 酶 活性 。(b) 在 非 
复制 DNA PTA 重复 中 发 生 的 两 碱 基 滑 脱 。 误 配 区 形成 单 链 环 ,它们 可 能 是 切 离 和 误 配 修复 的 目标 。 结 果 ( 有 是 缺失 
还 是 插入 ) 依 赖 于 倒 底 是 哪 条 链 被 切 离 和 被 修复 ,以 及 在 DNA 修复 过 程 中 究竟 是 哪 条 链 被 当 作 模 板 。 自 Levinson 
和 Gutman (1987) 修 改 而 成 。 
酸 的 连续 长 段 。 裂 颖 的 长 度 基 本 上 展示 出 双 峰 型 频率 分 布 , 短 裂 颖 (到 20 一 30 核 苷 酸 为 止 ) 常 常 是 由 
DNA 复制 过 程 中 的 错误 所 造成 的 , 象 上 面 讨论 过 的 滑脱 链 误 配 ， CaS 
Bt 36 th BK DNA 转 座 所 造成 。 

FE Fit SK, UN RS SE AE TO KE RAR FE 23) FC WU KS ea) BE HE SP 
下 游 的 编码 序列 将 会 按 错误 的 相位 阅读 。 这 种 突变 称 框架 移动 (frameshift) 突 变 。 结 果 , 一 个 裂缝 不 仅 
会 导入 许多 氮 基 酸 的 改变 ,而 且 还 可 能 使 终止 密码 子 被 抹 掉 或 者 在 相位 中 导 和 新 的 终止 密码 子 ,后 果 
是 产生 长 度 异 常 的 蛋白 质 ( 图 1 一 9) 


突变 的 空间 分 布 
突变 不 是 在 整个 基因 组 中 随机 出 现 的 .有 些 区 域 比 另 一 些 区 域 更 容易 突变 ,它们 被 称 为 突变 的 热 


四 Bre Ui pee ea Pe i A A ak Sa a SA 
a em eR 5’ 一 TG 一 3' 。 志 核 苷 酸 5 一 TT 一 3' 在 原核 生物 中 是 一 个 突变 热点 ,但 在 真 核 生 物 中 
通常 不 是 . 在 细菌 中 ,含有 短 加 〔 即 "两 条 互补 链 读 起 来 相同 的 序列 ,如 5 二 GCCG- 
GC—3's-5'= GGCGCC— 3’ #1 5’/ -GGGCCC— 3’) HY DNA 内 的 区 域 ,被 发 现 比 其 他 区 域 更 易于 突 


变 。 在 真 核 生物 的 基因 组 中 , 串 接 重复 常常 是 缺失 和 插 人 的 热点 ,或 许 这 是 滑脱 链 误 配 所 造成 的 结果 。 


= 


(palindromes 


el4e 


my pave Ala Lew Val ‘Lew Lew Thr le “ Cys “de> “Ter 
AAG GCA CTG GTC CTG TTA ACA ATA TGT ATA TAA TACCATCGCAATAGGG 


AAG GCA CTG TCC TGT TAA CAATATGTATATAATACCATCGCAATAGGG 
bye Ala’ “Leu. Phe Cys Ter 


iu oAla..Asn..Val. Leu. Leu. Thr... Ile... Cys. Ie Ter 
AAG GCA AAC GTC CTG TTA ACA ATA TGT ATA TAA TACCATCGCAATAGGG 


AAG-GCA AAC GGT CCT GTT AAC AAT ATG TAT ATA ATA.CCA TCG CAA TAG GG 
Bye pvAla Asn Gly «Pro ~ Vab(iiAsn’\ Asn >) MetoyTyr: De) «Tle Prov Ser Gin ‘Ter 
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图 1 一 9 由 缺失 或 插入 造成 的 阅读 框架 发 生 框 架 移动 的 例子 。(a) 缺 失 一 个 G 造 成 成 熟 前 终止 。(b) 插 入 一 个 G， 
结果 抹 掉 了 一 个 终止 密码 子 。 终 止 密码 子 下 划 有 横 线 。 


习题 


1. 从 某 种 哺乳 动物 中 找 出 两 个 完全 定 序 了 的 为 蛋白 质 编码 的 基因 (你 可 以 应 用 数据 库 或 一 本 杂 
志 )。 确 定 它们 每 一 个 的 内 含 子 和 编码 外 显 子 间 的 长 度 比 。 用 取 自 果 蝇 的 两 个 为 蛋白 质 编码 的 基因 再 
做 上 述 处理 。 哪 些 基因 的 内 含 子 与 外 显 子 长 度 比 更 大 ? 

2. 从 某 种 哺乳 动物 中 找 出 一 个 完整 的 mRNA 序列 。 删 去 你 在 编码 区 中 最 先 碰 到 的 两 个 核 苷 酸 
CI。 判 断 是 否 有 一 个 成 熟 前 终止 密码 子 进入 阅读 框架 ,或 者 是 否 翻译 会 超越 原 终止 密码 子 而 延长 。 

3. 用 习题 2 中 的 序列 ,在 编码 区 中 第 6 个 C 后 插入 一 个 A。 插 和 人 将 会 怎样 影响 翻译 ? 

4. 用 习题 2 中 的 序列 ,判断 有 多 少 密码 子 能 经 一 次 核 苷 酸 蔡 换 而 突变 成 终止 密码 子 。 

5. 用 习题 2 中 的 序列 ,判断 密码 子 第 3 位 中 有 多 少 转换 是 同 义 的 ,而 又 有 多 少 颠 换 是 同 义 的 。 
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2 群体 中 基因 的 动力 学 


群体 遗传 学 探讨 发 生 在 群体 内 的 遗传 变化 。 本 章 将 介绍 某 些 对 理解 分 子 进化 来 说 至 关 重 要 的 、 群 
体 遗 传 学 的 基本 原理 。 群 体 遗 传 学 的 一 个 基本 问题 ,是 确定 一 个 突变 基因 的 频率 在 各 种 进化 力量 的 影 
响 下 ,将 如 何 随时 间 而 变化 .此 外 ,从 长 期 的 观点 看 ,重要 的 是 决定 一 个 新 的 突变 变异 型 完全 替代 群体 
中 的 老 变异 型 的 概率 ,以 及 估计 替代 过 程 将 会 进行 得 多 快 。 与 形态 上 的 改变 不 同 , 许 多 分 子 变化 好 象 
对 生物 的 表 型 只 有 很 小 的 影响 ,所 以 ,分 子 变 异型 的 频率 受 机 遇 的 影响 强烈 。 因 此 ,在 处 理 分 子 进化 
时 ,机 遇 因素 应 该 被 考虑 进去 。 


2.1 等 位 基因 频率 方面 的 改变 。 


一 个 基因 在 染色 体 或 基因 组 上 的 位 置 称 基因 座位 (locus) , 某 一 给 定 基 因 座 位 上 所 选取 的 基因 形 
式 称 等 位 基因 (alleles) .在 一 个 群体 中 , 某 一 基因 座位 上 可 能 有 一 个 以 上 的 等 位 基因 存在 ,它们 的 相对 
比例 称 等 位 基因 频率 (allele frequencies) 或 基因 频率 (gene frequencies)。 例 如 ,我 们 假定 。 一 个 大 小 为 
N 的 单 倍 体 群 体 中 , 某 一 基因 座位 上 有 各 具 ni An, 个 拷贝 的 两 个 等 位 基因 。 那 么 ,它们 的 等 位 基因 
频率 就 分 别 等 于 和 和 天。 注意 ,其 中 心 二 nm 一 N ,而 对 十 冰 一 1。 

进化 是 在 群体 的 遗传 组 成 方面 发 生变 化 的 过 程 . 因 此 ,进化 过 程 中 最 基本 的 部 分 是 等 位 基因 频率 
随时 间 的 变化 .事实 上 ,从 进化 的 观点 看 ,一 个 新 突变 要 变 得 有 意义 就 必须 增加 它 自 己 的 频率 FRA 
在 群体 中 被 固定 (fixed)( 即 在 随后 的 世代 中 所 有 个 体 将 共有 同一 种 突变 型 等 位 基因 )。 如 果 不 增加 自 
己 的 频率 ,那么 这 个 突变 将 对 该 物种 的 进化 史 几 乎 没有 影响 .对 于 一 个 要 增加 频率 的 突变 型 等 位 基因 
来 说 ,必须 是 某 些 因子 而 不 是 突变 来 挫 和 作用。 这 些 因子 包括 自然 选择 ,随机 遗传 漂 变 ,重组 和 迁徙 。 

为 了 认识 进化 的 过 程 ,我 们 必须 研究 以 上 因子 是 如 何 影 响 等 位 基因 频率 的 变化 的 。 本 书 里 ,我 们 
只 讨论 自然 选择 和 随机 遗传 漂 变 。 在 涉及 形态 学 性 状 的 经 典 进化 研究 中 ,自然 选择 被 看 成 是 进化 的 主 
要 驱动 力量 。 与 此 成 鲜明 对 比 的 是 ,在 分 子 水 平 上 随机 遗传 漂 变 被 认为 在 进化 中 起 重要 作用 。 

研究 群体 中 的 遗传 变化 有 两 种 数学 途径 :决定 性 的 和 随机 性 的 .决定 性 模型 (deterministic model) 
较 简 单 。 它 假定 ,群体 中 等 位 基因 频率 从 这 一 代 到 下 一 代 的 改变 是 以 唯一 的 方式 发 生 的 ,并 且 能 根据 
关于 初始 条 件 的 知识 毫 不 含糊 地 预测 出 来 .严格 说 来 ,此 途径 仅 当 两 个 条 件 满 足 时 才能 应 用 :(1) 群 体 
在 大 小 上 是 无 限 的 ,和 (2) 环 境 或 者 不 随时 间 而 变 或 者 按 决定 性 规则 而 变 。 这 些 条 件 在 自然 界 显 然 绝 
不 会 得 到 满足 ,因此 , 纯 决 定性 途径 对 于 描述 群体 中 等 位 基因 频率 随时 间 的 变化 可 能 是 不 够 的 。 随 机 
的 或 不 可 预料 的 等 位 基因 频率 方面 的 波动 也 必须 被 考虑 进去 。 

处 理 随 机 波动 需要 一 种 不 同 的 数学 途径 。 随 机 性 模型 (stochastic models) 假 定 等 位 基因 频率 的 变 
化 按 或 然 性 方式 发 生 , 即 ,从 这 一 世代 中 关于 条 件 的 知识 我 们 不 能 含糊 地 预料 下 一 世代 里 的 等 位 基因 
频率 ,而 只 能 决定 可 能 出 现 的 某 些 等 位 基因 频率 的 出 现 概率 .显然 ,随机 性 模型 比 决定 性 模型 更 可 取 ， 
因为 它们 建立 在 更 为 现实 的 假定 之 上 。 不 过 ,决定 性 模型 在 数学 处 理 上 要 容易 得 多 ,而 且 在 某 些 条 件 
下 它们 也 能 得 出 足够 精确 的 近似 结果 。 以 下 ,我们 将 按 决 定性 方式 处 理 自然 选择 。 


2.2 自然 选择 


自然 选择 Cnatural selection ) 被 定义 成 :一 个 群体 内 遗传 上 不 同 的 个 体 或 基因 型 的 有 差别 的 增殖 。 
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有 差别 的 增殖 是 由 个 体 间 如 死亡 率 、 能 育 性 .生殖 力 、 交 配 成 功 和 后 代 生 活力 等 因子 方面 的 差异 所 造 
成 的 。 自然 选择 是 个 体 间 在 与 增殖 有 关 的 性 状 方面 存在 遗传 变异 的 必然 结果 。 如 果 一 个 群体 由 在 这 
类 性 状 方面 相互 无 差别 的 个 体 所 组 成 , 则 它 将 不 会 受到 自然 选择 。 选 择 导致 等 位 基因 频率 随时 间 而 
变 。 然 而 ,仅仅 是 等 位 基因 频率 从 一 代 到 另 一 代 发 生变 化 ,并 不 一 定 表示 自然 选择 在 起 作用 。 别 的 过 
程 , 例 如 随机 遗传 漂 变 ,也 能 导 至 等 位 基因 频率 随时 间 的 改变 ( 见 后 面 的 内 容 )。 

eo eee eae 
过 ,由 于 一 个 群体 的 大 小 通常 受 其 所 处 环境 的 容量 限制 ,所 以 , 某 三 个 体 的 进化 成 功 不 是 由 其 绝 
对 适合 度 (absolute fitness) 而 是 由 其 与 群体 中 其 他 基因 型 相 比 的 相对 适合 度 (relative fitness) 所 决定 
的 。 在 自然 界 ,不 能 预期 一 个 基因 型 的 适合 度 在 所 有 世代 和 所 有 环境 条 件 下 保持 不 变 。 然 而 ,对 每 种 
基因 型 指定 一 个 恒定 的 适合 度 值 ,我 们 就 可 以 得 出 一 些 简单 的 理论 公式 ,它们 对 理解 由 自然 选择 导致 
的 群体 遗传 结构 变化 的 动力 学 是 很 有 用 的 。 在 某 些 最 简单 的 模型 里 ,我们 假定 生物 的 适合 度 仅 由 其 遗 
传 组 成 所 决定 。 我 们 还 假定 ,所 有 基因 座位 对 个 体 的 适合 度 的 贡献 相互 独立 ,所 以 每 一 基因 座位 都 能 
被 隔离 开 来 处 理 。 


群体 中 的 大 多 突变 型 都 会 降低 其 携带 i 。 这 类 突变 将 受到 淘汰 性 选择 并 且 最 
终 将 会 被 从 群体 中 去 除 。 这 种 的 选择 称 负 选 择 或 纯洁 (GBA Cogaive oF poring section 偶 


尔 ' 某 二 新 突变 可 能 与 群体 中 最 好 的 等 位 基因 一 样 合适 ,这 utral) ， 且 其 
命运 将 不 由 选择 所 决定 ?3 极 军 见地 ， 可 能 会 产生 一 个 能 给 其 携带 者 以 选择 优势 的 突变 型 。 这 类 突变 将 


人 
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下 面 我 们 将 考虑 一 个 有 两 个 等 位 基因 ， eres | 的 基因 座位 的 例子。 每 等 位 基因 可 被 指定 __ + 
内 在 适合 度 值 ; 它 可 能 是 优势 的 .劣势 的 ,或 中 性 的 。 然 而 ,这 种 指定 只 适用 于 单 倍 体 生 物 。 在 两 倍 体 
生物 中 ,适合 度 最 后 由 该 基因 座位 上 的 两 个 等 位 基因 间 的 相互 作用 所 决定 。 两 个 等 位 基因 ,将 有 三 种 
可 能 的 两 倍 体 基 因 型 :AIA ,AiA, 和 A:A: ,它们 的 适合 度 则 可 分 别 用 wi wie wok RA 
给 定 某 一 群体 中 等 位 基因 A, 的 频率 为 p, 该 互补 等 位 基因 A, 的 频率 为 q 王 1 一 p, 我 们 可 以 证 明 ， 
在 随机 交配 下 AJA ,AiA, 和 ALA, 的 频率 将 分 别 为 p ,2pq 和 号 。 一 个 维持 着 这 种 基因 型 比 的 群体 ， 
被 认为 是 处 于 哈 迪 一 温 伯 格 平 衡 (Hardy-Weinberg equilibrium) 。 1M .p=p’ +> (2pq) UK a=> 
(2pq) 十 qz。 ee eee) 
在 一 般 情 况 下 ,三 种 基因 型 被 指定 为 以 下 适合 度 值 和 初始 频率 
基因 型 AA, A,A, A.A, 
适合 度 Wi Wiz W22 
频率 P2 2pq q° 
现在 让 我 们 考虑 一 下 等 位 基因 频率 随 选 择 而 改变 的 动力 学 。 假 定 三 种 基因 型 的 频率 及 其 适合 度 
如 上 ，, 则 三 种 基因 型 AlAi ,AiA, A ALA, 对 下 一 世代 的 相对 贡献 ,将 分 别 为 pwii,2pqwiz 和 qzwz。 因 
此 ,等 位 基因 A, 的 频率 在 下 一 世代 将 变 成 


y 2 ee ed 
pw, + 2pqwy, + 9 oz 


每 世代 等 位 基因 A, 的 频率 改变 量 被 表示 成 Aq=q' 一 q。 我 们 可 以 证 明 


Ar = pal pwr 一 Wy) + q (Way x ¥en) 


p’wy, + 2pquy. + q° 2row， 

下 面 ,我 们 假定 A, 是 该 群体 中 的 原 等 位 基因 或 “ 老 ， 本 然后 ,我 们 来 考虑 一 个 新 突变 型 
等 位 基因 A, 出 现 后 ,等 位 基因 频率 变化 的 动力 学 。 为 了 数学 上 的 便利 ,我 们 给 予 A,A, 基因 型 的 适合 
度 值 为 1。 新 产生 的 基因 型 AiA, MAA, 的 适合 度 将 有 赖 于 A 和 As 间 相 互 作用 的 模式 .。 例如 ,如 果 
A, 对 A, 是 完全 显 性 的 ,那么 wavwb 和 wz 可 分 别 写成 1,1 十 s, 和 1 十 s, 如 果 A, 完全 隐 性 , 则 适合 
分 别 为 1,1,1 十 s。 这 里 s BHAA, 的 基因 型 与 A,Ai 间 的 适合 度 差异 。s 的 值 为 正 表 示 与 AlA, 比较 
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(2. 1) 


(2. 2) 


适合 度 增 高 ,而 为 负 时 则 表示 适合 度 降 低 。 
共 显 性 


在 选择 的 共 显 性 模式 (codominant mode of selection) 或 基因 选择 (genic selection) 中 ,两 种 纯 合 子 
有 着 不 同 的 适合 度 值 ,而 杂 合子 的 适合 度 则 为 两 种 纯 合 基因 型 的 适合 度 的 平均 值 。 三 种 基因 型 的 相对 
适合 度 值 可 写成 : 
基因 型 AA, AiA， A:A， 


适合 度 1 1 十 s 1 十 2s 
根据 等 式 2. 2, 在 共 显 性 下 我 们 得 等 位 基因 A. 的 每 世代 频率 改变 如 下 : 
4 天 (2. 3) 


~ 1+ 2spq + 2 
图 2 一 1 BARA s=0.01 的 等 位 基因 A, WI In tO. BOT) AB, FE A te ES Ze ET El 
等 位 基因 频率 的 前 提 下 增加 其 中 一 种 等 位 基因 的 频率 ,而 与 等 位 基因 在 群体 中 的 相对 频率 无 关 。 因 
此 ,基因 选择 是 一 种 定向 选择 (directional selection)。 注 意 ,在 低频 率 下 对 一 个 共 显 性 等 位 基因 的 选择 
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图 2 一 1 具 S=0.01 的 共 显 性 优势 等 位 基因 ,在 其 于 第 0 代 作 为 突变 的 结果 而 出 现 后 的 频率 。 
不 是 十 分 有 效 ( 即 ,等 位 基因 频率 的 变化 缓 慢 )。 原 因 在 于 , 当 A: 频率 低 时 ,等 位 基因 A, 处 于 杂 人 合子 
中 的 比例 较 大 。 例 如 , 当 A; 的 频率 为 0.5 50MM A, 等 位 基因 由 杂 合 子 携带 ,而 若 A, 的 频率 为 0. 
01, 则 99%% 的 这 种 等 位 基因 都 处 于 杂 合 子 中 。 因 为 杂 合 子 带 有 两 种 等 位 基因 ,受到 的 选择 压力 比 纯 合 
子 A;A; 的 弱 ( 即 s 和 2s 的 关系 ), 所 以 在 低 q 值 下 等 位 基因 频率 的 总 改变 量 就 小 。 


超 显 性 


在 选择 的 超 显 性 模式 (overdominant mode of selection ) , 杂 合 子 有 最 高 的 适合 度 。 于 是 : 
SEA AA, AA, A2A2 
适合 度 1 1 十 s” 1+t 
这 里 s>O 目 s>t。 根据 ALA, 的 适合 度 是 高 于 、 等 于 或 低 于 AVA, 的 适合 度 ,t 可 相应 地 吉 正 值 、 
零 、 或 负 值 。 等 位 基因 频率 的 变化 表示 成 
On agen = (2. 4) 
图 2 一 2 表示 一 个 受 超 显 性 选择 的 等 位 基因 的 频率 变化 .与 造成 一 个 等 位 基因 最 终 从 群体 申 消 失 
的 著 显 性 选择 体制 不 同 , 在 超 显 性 选择 下 ,群体 迟早 将 达到 一 种 两 等 位 基因 共存 的 平衡 状态 。 平 衡 送 
到 后 将 看 不 到 等 位 基因 频率 的 进一步 变化 ( 即 Aq=o)。 所 以 , 超 显 性 选择 属于 一 种 称 为 平衡 选择 或 稳 
定 化 选择 (balancing or stabilizing selection) 的 选择 体制 。 
4 18> 


处 于 平衡 时 的 等 位 基因 AD 的 频率 可 通过 令 等 式 2.4 的 Aq 一 o 而 解 出 : 
(2.'5) 


s 
了 一 2 从 
当 t 王 0( 即 两 种 纯 合 子 有 相同 的 适合 度 值 ) 时 ,两 种 等 位 基因 的 平衡 频率 将 都 是 50% 。 
1.0 
0.8 


0.6 


0.4 


0.2 


世代 


图 2 一 2 一 个 受 超 显 性 选择 的 等 位 基因 的 频率 变化 。 起 始 频率 从 上 到 下 各 为 ;0.99,0.75,0.25 Fo 0. 013s=0. 250 
及 t=0.125。 因 为 s 和 t 的 值 都 特别 大 ,所 以 等 位 基因 频率 的 变化 迅速 。 注 意 , 在 q 一 0.667 处 有 一 个 稳定 平衡 。 自 
Hartl 和 Clark(1989) 修 改 而 成 。 


2.3 随机 遗传 漂 变 


正如 上 面 提 到 的 ,自然 选择 不 是 引起 等 位 基因 改变 的 唯一 因子 。 等 位 基因 频率 变化 也 可 因 机 遇 而 
产生 ,虽然 在 这 种 情况 下 变化 不 是 有 方向 性 的 而 是 随机 的 .产生 等 位 基因 频率 的 随机 波动 的 一 个 重要 
因子 是 生殖 过 程 中 配子 的 随机 取样 (图 2 一 3)。 之 所 以 出 现 取样 问题 ,是 因为 在 自然 界 中 绝 大 多 样 情 
况 下 , 任 一 个 世代 中 可 用 配子 的 数目 都 远大 于 下 一 世代 所 产生 的 成 年 个 体 数 。 换 句 话 说 ,只 有 一 小 部 
分 配子 成 功 地 发 育 到 成 体 。 在 一 个 经 受 孟 德尔 式 分 离 的 两 倍 体 群体 中 ,即使 没有 配子 过 剩 , 即 每 一 个 
_ 体 对 下 二 世代 正好 贡献 两 个 配子 ,取样 问题 也 会 发 生 。 原 因 是 , 杂 合 子 能 产生 两 种 配子 ,而 传 给 下 一 世 
代 的 两 个 配子 由 于 机 遇 却 可 能 是 同一 类 型 的 。 

为 了 看 取样 造成 的 后 果 , 让 我 们 考虑 一 个 群体 中 所 有 个 体 有 同样 的 适合 度 以 至 于 选择 不 起 作用 
的 理想 情形 。 我 们 再 把 问题 进一步 简化 ,考虑 一 个 没有 重奏 世代 的 群体 ( 即 一 群 同时 繁殖 的 个 体 ) ,这 
样 , 任 一 给 定 世代 都 能 与 前 一 世代 和 后 一 世代 毫 不 含糊 地 区 分 开 来 。 该 被 考虑 的 群体 为 两 倍 体 , 由 N 
个 不 体 所 组 成 ,所 以 ,对 任 一 给 定 的 基因 座位 来 说 该 群体 含有 2N 个 基因 。 接 下 来 我 们 处 理 具 有 两 个 
等 位 基因 A, 和 A,、 频 率 分 别 为 p 和 q=1 一 p 的 一 个 基因 座位 的 简单 例子 。 当 从 无 限 的 配子 库 中 抽取 
ON 个 配子 时 ,样本 中 正好 含有 i 个 A, 型 基因 的 概率 p, 由 二 项 式 概率 函数 给 出 : 

PS SF a 
\ 1 ie i7TQQN — ai’? 

对 于 两 种 等 位 基因 共存 ( 即 0<p<1) 的 群体 而 言 ,p, 总 是 大 于 零 的 ,所 以 ,等 位 基因 频率 可 以 无 
需 选 择 的 帮助 而 一 代 一 代 地 改变 。 

只 是 由 于 机 遇 而 造成 等 位 基因 频率 变化 的 过 程 称 随机 遗传 漂 变 (random genetic drift), 不 过 要 注 
意 , 随 机 遗传 漂 变 也 可 由 不 是 配子 取样 的 过 程 所 引起 。 例 如 ,选择 强度 上 的 随机 变化 也 能 导 至 等 位 基 
因 频 率 方面 的 随机 变化 。 

我 们 用 图 2 一 4 来 说 明 随机 取样 对 不 同 大 小 群体 的 等 位 基因 频率 的 影响 。 等 位 基因 频率 一 代 一 代 
地 改变 ,但 变化 的 方向 在 任 一 时 间 点 上 都 是 随机 的 。 随 机 漂 变 的 最 明显 特征 是 ,等 位 基因 频率 的 波动 
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(2. 6) 


“A” Se fiz 
世代 基因 的 频率 


leoooeceeoce| 9 
配子 库 中 的 等 位 基因 频率 ¥ 
与 产生 配子 的 成 体 中 的 
等 位 基因 频率 完全 一 样 。 

从 配子 库 中 抽出 10 二 
个 配子 的 随机 取样 
0.60 
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0.80 
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图 2 一 3 配子 的 随机 取样 。 假 定 每 一 世代 的 配子 库 ( 大 长 方块 ) 中 的 等 位 基因 频率 精确 地 反映 了 亲本 世代 (小 长 方 

块 ) 的 成 体 中 的 等 位 基因 频率 。 因 为 群体 大 小 是 有 限 的 ,所 以 等 位 基因 频率 上 下 波动 。 自 Bodmer fe Cavalli-Sforza 
(1976) 修 改 而 成 。 
在 小 群体 中 比 在 大 群体 中 要 突出 得 多 。 

让 我 们 跟踪 由 相继 世代 中 随机 遗传 漂 变 过 程 造成 的 等 位 基因 频率 改变 的 动力 学 。 等 位 基因 Ai 
的 频率 被 写成 pu\ pi\p*、…\、pt, 其 中 下 标 指 世代 数 。 等 位 基因 A, 的 起 始 频 率 为 pe。 类 似 地 ,等 位 基因 
A, 的 频率 为 qu\qj\q、…、qt。 在 没有 选择 时 ,我 们 期 望 p 与 pe 相等 ,qi Sq 相等 , 且 对 以 后 世代 都 是 
如 此 。 然 而 ,群体 是 有 限 的 这 一 事实 , 则 意味 着 p; 只 是 在 平均 上 ( 即 重 复 取样 无 限 次 时 ) 才 等 于 po。 而 
实际 情况 是 ,取样 在 每 一 世代 里 只 发 生 一 次 ,所 以 pi 通常 不 同 于 po. 在 第 2 代 里 ,Ai 的 频率 (p:) 将 不 
再 依赖 于 po 而 依赖 于 pi。 类 似 地 ,在 第 3 代 Ai 的 频率 (ps) 将 既 不 依赖 于 p 也 不 依赖 于 pu, 而 是 依赖 
于 pz。 所 以 ,随机 遗传 漂 变 的 最 重要 的 性 质 是 其 黑 积 (cumulative behavior 地 传 下 
去 , 某 一 等 位 基 由 的 频率 将 倾向 于 越 来 越 偏 离 其 起 始 频率 。 
为 了 看 一 看 随机 遗传 漂 变 的 累积 效应 ,让 我 们 考虑 一 下 下 面 的 数字 例子 。 某 一 群体 由 5 个 两 倍 体 
个 体 所 组 成 ,在 某 一 基因 座位 上 的 两 个 等 位 基因 OA 和 AD ,频率 均 为 50% 。 现 在 我 们 要 间 ,“ 在 下 二 世 
代 得 到 同样 的 等 位 基因 频率 的 概率 是 多 少 ?” 应 用 等 式 2. 6, 我 们 得 到 值 为 0. 25 的 概率 。 换 句 话 说， 在 
75 儿 的 情况 下 第 2 代 的 等 位 基因 频率 将 不 同 于 起 始 频 率 。 而 且 , 在 以 后 的 世代 里 保留 着 起 始 等 位 基因 
频率 的 概率 也 不 再 是 0. 25 ,而 将 会 越 来 越 小 。 例 如 ,在 第 3 代 群 体 中 有 50%A, 的 概率 约 为 18% ,而 
10 代 以 后 该 概率 就 只 有 约 5% (图 2 一 5)。 相 应 地 ,Ai 或 者 A, 丢失 的 概率 则 随时 间 的 推移 而 增加 , 因 
为 ,所 有 被 选取 的 配子 正好 带 有 同样 的 等 位 基因 的 事件 ,在 每 一 世代 中 都 具有 一 个 有 限 的 概率 。 一 且 
某 天 种 等 位 基因 的 频率 达到 0 或 者 1, 它 的 频率 在 以 后 的 世代 里 就 不 再 变化 了 。 第 一 种 情形 被 称 为 丢 
失 (l6se) 或 灭绝 (extinction ) ,第 二 种 则 称 之 为 固定 (fixation)。 如 果 取 样 过 程 持 续 一 个 相当 长 的 时 期 ， 
则 这 类 可 能 情形 将 必然 会 达到 。 
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图 2 一 4 Dh des cnn wexe eae Ger 最 小 的 群体 42 代 后 达到 固定 。 另 两 个 群体 
150 代 以 后 还 是 多 态 性 的 ,但 如 果实 验 继续 得 足够 长 则 终 将 会 达到 固定 (等 位 基因 频率 一 0%% 或 100%)。 自 Bodmer 
和 Cavalli-Sforza (1976). 

随机 遗传 漂 变 的 最 终结 果 是 一 | 有 别 的 基因 的 丢失 。 要 不 发 生 这 样 的 结 


果 ,除非 通过 象 突变 或 迁移 中 输入 ,或 者 由 某 种 平衡 选择 积极 地 
维持 着 多 态 现象 。 
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图 2 一 5 两 个 选择 中 性 的 等 位 基因 ,有 入 一; 和 bb 一 U5, 其 维持 与 起 始 等 位 基因 频率 相同 的 概率 随时 间 而 变 的 情 
形 n = 


- 


_£ 


2.4 有 效 群 体 大 小 


群体 生物 学 的 一 个 基本 参数 是 群体 大 小 (population size)N, 它 被 定义 成 :一 个 群体 中 的 总 个 体 
数 。 然 而 ,从 群体 遗传 学 和 进化 的 观点 看 ,将 被 考虑 的 有 关 数 仅 由 那些 积极 参 人 繁殖 过 程 的 个 体 所 构 
成 。 由 于 并 非 所 有 个 体 都 参 人 繁殖 ,所 以 ,影响 进化 过 程 的 群体 大 小 与 调查 统计 的 大 小 是 不 同 的 。 群 
体 的 这 部 分 称 有 效 群体 大 小 Ceffective population size) ,并 用 Ne RA. 

一 般 来 说 ,Ne FN, AME EIN 要 小 得 多 。 有 各 种 各 样 的 因素 能 造成 这 种 差异 。 例如 ,在 一 
个 具有 重奏 世代 的 群体 中 ,在 任何 时 间 里 ,群体 的 部 分 将 由 处 于 生殖 前 或 生殖 后 阶段 的 个 体 所 组 成 。 
由 于 发 言 阶段 重大 ,有 效 大 小 可 能 比 调查 统计 大 小 要 小 很 多 。 例 如 , 据 根 井 和 今 泉 (Nei 和 Imaizumi, 
1966) 报 导 , 人 类 的 Ne 仅 略 大 于 N/3。 
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有 效 群 体 大 小 比 调 查 统计 大 小 要 小 ,也 可 能 发 生 在 涉及 生殖 的 雄性 个 体 数 不 等 于 雌性 个 体 数 的 
时 候 。 这 种 情况 在 多 配偶 制 的 物种 , 象 社会 性 哺乳 类 和 和 领土 性 鸟 类 ,或 者 存在 无 生殖 阶层 的 物种 (例如 
蜜蜂 .蚂蚁 和 白蚁 ) 中 光 其 明显 .如果 一 个 群体 由 Nu 个 雄 体 和 IN 个 上 肉体 所 组 成 , 则 Ne 将 由 以 下 公式 
给 出 : 
4N,,N ; 
Ro N; 
TE RAE EET RAS EET ROS. BW Ne 总 是 要 比 N 小 。 举 一 个 极端 的 例子 ,我 们 假定 一 个 
大 小 为 N 的 群体 中 ,所 有 肉体 (N/2) 以 及 仅 有 一 个 雄 体 参 人 生殖 过 程 。 应 用 等 式 2.7, 我 们 看 到 Ne= 
2N/V(I 十 N/2)。 如 果 N 比 1 大 得 多 , 则 Ne 将 等 于 4, 而 与 调查 统计 到 的 群体 大 小 无 关 。 

有 效 群 体 大 小 也 可 能 因 群 体 大 小 的 长 期 变动 而 大 为 降低 ,后 者 可 由 象 环 境 的 灾变 ,生殖 的 循环 模 
式 地 区 性 灭绝 和 重建 事件 等 因素 所 引起 。 例 如 ,在 一 个 经 历 n 个 世代 的 物种 中 ,长 期 有 效 群 体 大 小 


(long-term effective population size) fH : 


Ne = 2-7) 


Ne a aS TT (2. 8) 


Mee es yt ‘ 
给 出 ,其 中 Ni 是 第 i 世 代 的 群体 大 小 。 换 言 之 ,Ne 。 等 于 Ni 值 的 调和 平均 ,结果 它 更 接近 于 Ni 中 的 最 
小 值 而 不 是 最 大 值 。 类 似 地 ,如 果 一 众 群体 经 历 一 次 瓶颈 , 则 有 效 群体 大 小 将 大 为 降低 。 


2.5 基因 替换 


基因 蔡 换 (gene substitution) 被 定义 成 一 个 过 程 , 经 此 ,一 个 突变 型 等 位 基因 将 完全 代替 群体 中 占 
优势 的 或 “野生 型 (wild type) 等 位 基因 。 在 此 过 程 中 ,一 个 突变 型 等 位 基因 在 群体 中 产生 ,通常 以 一 
个 拷贝 出 现 ,并 且 经 一 定 世代 数 以 后 被 固定 。 一 个 新 的 等 位 基因 固定 所 花 的 时 间 称 固定 时 间 (fixation 
time) .不 过 ,并 非 所 有 新 突变 型 都 能 达到 固定 。 事 实 上 ,它们 中 的 大 多 数 在 几 个 世代 后 就 会 被 丢失 。 所 
以 ,我 们 还 需要 谈 谈 固定 概率 (fixation probability) 问 题 ,以 及 讨论 影响 着 一 个 新 突变 型 等 位 基因 在 群 
体 中 固定 的 机 会 的 因素 。 

新 突变 在 群体 内 不 断 地 产生 着 .结果 ,基因 痊 换 不 断 地 发 生 ,用 个 等 位 基因 替代 另 一 个 ,而 有 时 
它 自己 又 被 一 个 新 的 等 位 基因 所 替代 。 所 以 ,我 们 才能 痰 到 革 因 普 扫 的 速率 , 即 每 单位 时 间 的 茧 所 志 
固定 数 。 


固定 概率 


某 一 特定 等 位 基因 在 群体 中 被 固定 的 概率 有 赖 于 ;1) 起 始 频率 ,(2) 选 择优 势 度 或 劣势 度 s,(3) 
有 效 群 体 大 小 Ne 下 面 ,我 们 将 考虑 基因 选择 的 情形 ,并 假定 三 种 基因 型 AIA,,A,A, 和 A,A, 的 相对 


适合 度 分 别 为 1,1 十 s 和 1 十 2s。 


木村 (Kimura,1962) 曾 证 明 ,A, 的 固定 概率 由 
站 


p =a ee (2.9) 


给 出 ,其 中 q 为 等 位 基因 A, 的 起 始 频率 。 由 于 当 x 很 小 时 er-*<z1_x, 所 以 等 式 2.9 在 x 趋 近 于 0 时 
简化 成 p<zq。 所 以 ,对 于 一 个 中 性 等 位 基因 而 言 ,固定 概 率 等 于 它 在 群体 中 的 频率 。 例如 ,一 个 频率 为 
40 欠 的 中 性 等 位 基因 , 它 将 在 40 六 的 事例 中 国定 而 在 60%% 的 事例 中 丢失 .这 可 以 从 直观 上 认识 ,因为 
在 中 性 等 位 基因 的 场合 ,固定 是 由 不 偏 棚 任 何等 位 基因 的 随机 遗传 漂 变 所 造成 的 。 

“我 们 注意 到 个 AGRERERARN HAREBESUCAET he, cee 1/(C2N) 的 起 始 
频率 。 一 个 突变 型 等 位 基因 的 固定 概率 p, 可 在 等 式 2.9 中 用 1/(2N) 代 蔡 4 来 得 出 。 当 s 关 0 时 ， 


和 (2. 10) 


对 于 至 个 中 性 突变 ,等 式 2.10 BH 
+226 


人 
p= oN (ZA) 


如 果 群 体 大 小 与 有 效 群 体 大 小 相同 , 则 等 式 2. 10 简化 成 
t—e* : 
| 二 l—e™ (2.42) 
如 果 s 的 绝对 值 较 小 , 则 我 们 得 
2s 
1 eu 
WF s 取 正 值 而 N 的 值 较 大 时 ,等 式 2.13 简化 为 
p & 2s (2. 14) 
所 以 ,如 果 一 个 有 利 突变 产生 于 一 个 大 群体 中 且 其 超越 其 他 等 位 基因 的 选择 优势 度 较 小 ,比如 说 不 到 
5% ,那么 其 固定 的 概率 将 近似 等 于 其 选择 优势 度 的 两 倍 。 例如 , 若 一 个 具 s=0.01 的 新 突变 在 群体 中 
产生 , 则 其 最 终 固定 的 概率 即 为 2%% 。 
现在 我 们 考虑 一 个 数学 例子 。 一 个 新 的 突变 型 在 一 个 有 1000 个 个 体 的 群体 中 产生 。 如 果 (1) 它 
是 中 性 的 ,(2) 它 给 出 0.01 的 选择 优势 度 ,或 (3) 它 具有 0. 001 的 选择 劣势 度 ,那么 该 等 位 基因 将 在 群 
体 中 国定 的 概率 各 为 多 少 ? 为 了 使 问题 简化 ,我 们 假定 N 王 Ne。 对 中 性 场合 来 说 ,固定 的 概率 是 1/ 
(2N) 王 0.05%%。 由 等 式 2. 12, 我 们 得 到 优势 和 劣势 情况 下 固定 的 概率 各 为 2% 和 10. 004% 。 这 些 结果 
是 很 值得 注意 的 ,因为 它们 从 本 质 表 示 一 个 有 利 突变 并 不 总 是 会 在 群体 中 固定 。 事 实 上 ,具有 s=0. 
01 的 选择 优势 度 的 所 有 突变 中 ,98%% 将 会 因 机 遇 而 丢失 。 此 理论 结果 极为 重要 ,因为 它 表 明 , 把 适应 
性 进化 当成 有 利 突 变 从 群体 中 产生 并 总 是 会 在 以 后 的 世代 中 兴旺 的 过 程 是 幼稚 的 观点 。 而 且 , 即 使 是 
轻微 有 害 的 突变 也 具有 一 个 在 群体 中 固定 的 有 限 概率 ,尽管 这 是 一 个 小 概率 。 一 个 有 害 的 等 位 基因 也 
可 能 会 在 群体 中 固定 ,仅仅 这 一 事实 就 能 有 力 地 说 明 机 遇 作 用 在 进化 期 间 对 决定 突变 的 命运 方面 的 
重要 性 。 


固定 时 间 


一 多 等 位 基因 固定 或 丢失 所 需要 的 时 间 与 该 等 位 基因 的 频率 和 群体 的 大 小 有 关 。 达 到 固定 或 丢 
失 的 尝 均 时 间 随 着 等 位 基因 的 频率 分 别 趋 近 于 1 或 0 而 越 来 越 短 。 

在 处 理 新 突变 时 ,对 固定 和 丢失 分 开 处 理 要 方便 一 些 。 以 下 ,我们 对 那些 最 终 将 在 群体 中 固定 的 
突变 型 的 平均 固定 时 间 进 行 处 理 。 这 一 变量 称 为 条 件 固定 时 间 (conditional fixation time) 。 在 一 个 两 倍 
体 群 体 中 一 个 新 突变 的 起 始 频率 , 据 定义 为 q=1/(C2N) ,此 例 的 平均 条 件 固定 时 间 i, 已 由 木村 和 太田 
(Kimura 和 Ohta,1969) 算 出 。 对 于 一 个 中 性 突变 而 言 , 它 由 下 式 所 近似 给 出 : 

说 《2. 15) 
而 对 于 一 个 具 选 择优 势 度 s 的 突变 来 说 , 它 近似 为 
t = (2/s)in(2N) 代 (2. 16) 


(2. 13) 


pr 


这 里 In RA BR WHR. 

Aa OT oi BA AB [el SE AES FY fe) A ERT Be. AL AAA 10° 的 有 效 群 体 大 小 和 2 年 的 
世代 (间隔 ) 时 间 。 在 这 些 条 件 下 ,一 个 中 性 突变 在 群体 中 固定 平均 要 花 8 正 万 年 。 相 比 之 下 ,一 个 具 
1 儿 的 选择 优势 度 的 突变 在 同样 的 群体 中 固定 则 只 花 约 5800 年 .。 有 趣 的 是 ,一 个 具 选 择 劣势 度 s 的 有 
害 等 位 基因 其 条 件 固 定时 间 与 具 选 择优 势 度 s 的 有 利 等 位 基因 的 正好 相等 (Maruyama 和 Kimura, 
1974) 。 如 果 一 个 有 害 等 位 基因 被 给 予 高 丢失 概率 , 则 这 一 点 就 可 从 直观 上 加 以 理解 。 即 ,对 于 一 个 注 
定 要 在 群体 中 固定 的 有 害 等 位 基因 而 言 ,固定 必 须发 生得 非常 快 。 

图 2 一 6 中 我 们 给 出 了 关于 有 利 的 和 中 性 的 突变 的 基因 替换 动力 学 过 程 。 我 们 注意 到 ,有 利 突 变 
或 者 迅速 丢失 或 者 迅速 在 群体 中 固定 。 与 之 不 同 的 是 ,中 人 性 等 位 基因 的 频率 变化 则 是 缓慢 的 ,上 且 固定 
时 间 比 有 利 突 变型 的 要 长 得 多 。 


基因 替换 速率 
我 们 现在 考虑 一 下 替换 速率 (rate of substitution) , 它 被 定义 为 :每 单位 时 间 里 达到 固定 的 突变 型 


(a) 有 利 突变 
ht 
1 


等 位 基因 频率 


of | eames 


图 2 一 6 基因 替换 的 动力 学 过 程 a) 有 利 的 和 (b) 中 性 的 突变 。 有 利 突 变 或 者 很 快 从 群体 中 丢失 或 者 迅速 被 国定 ， 
所 以 它们 对 遗传 多 态 性 的 贡献 小 。 另 一 方面 ,中 性 等 位 基因 的 频率 相 比 之 下 变化 非常 缓慢 ,所 以 产生 大 量 的 瞬时 多 
态 。t 为 条 件 固定 时 间 ,而 1/a 是 接连 的 两 固定 事件 间 的 平均 时 间 。 自 Nei(1987) 
的 数目 。 我 们 将 先 考 虑 中 性 突变 。 如 果 突 变 以 每 世代 每 基因 的 速率 发 生 ,那么 在 一 个 大 小 为 N 的 
两 倍 体 群 体 中 产生 的 突变 型 数 即 为 每 世代 2Nu 因为 这 些 突变 中 每 一 个 的 固定 概率 都 是 17(C2N) ,所 
以 ,我 们 用 总 突变 数 乘 以 它们 的 固定 概率 即 可 得 到 中 Y 基 因 的 替换 速率 ， 
K=u (2.17) 
PAE 0 AE SPE OR ER eB a EF Be a MR A fF 8 24 5 Kimura, 19688). WRK 
们 注意 到 ,在 一 个 大 群体 中 ,每 代 产生 的 突变 数 虽 高 但 每 个 突变 的 固定 概率 却 低 , 则 该 结果 就 可 以 直 
观 地 加 以 理解 。 相 比 之 下 ,在 一 个 小 群体 中 每 代 产生 的 突变 数 虽 低 , 但 每 突变 的 固定 概率 却 高 ， 结 
采 是 ,中 性 突变 的 替换 速率 与 群体 大 小 无 关 。 
对 有 利 突变 而 言 , 替 换 速 率 可 用 突变 率 乘 以 如 等 式 2. 14 给 出 的 每 基因 的 固定 概率 来 求 得 。 对 于 
As>0 的 基因 选择 ,我们 得 ， 
K = 4Nsu (2.18) 
RES» YE BP LE PK Is CN) PE HA Es) .以 及 突变 率 Cu)， 


2.6 遗传 多 态 性 


如 果 一 个 基因 座位 在 群体 中 有 两 个 或 更 多 的 等 位 基因 存在 , 则 它 就 被 说 成 是 多 态 性 的 (polymor 
phic)。 然 而 ,如 果 其 中 一 个 等 位 基因 有 非常 高 的 频率 ,比如 说 99 斩 或 更 高 ,那么 ,其 他 等 位 基因 看 来 都 
不 能 在 样本 中 被 观察 到 ,除非 样本 特别 大 。 所 以 ,从 实际 出 发 ,如 果 那 种 最 党 见 的 等 位 基因 的 频率 小 于 
99% ，, 则 该 基因 座位 通常 被 定义 为 多 态 性 的 。 该 定义 显然 有 点 武断 ,而 且 在 文献 中 还 可 发 现 有 人 用 别 
的 标准 。 

中 24 ° 


测度 某 一 群体 的 多 态 性 程度 的 最 简单 方法 之 一 ,是 通过 将 多 态 性 基因 座位 数 用 所 取样 本 的 基因 
座位 总 数 来 除 ,以 算出 多 态 性 基因 座位 的 平均 比例 。 然 而 ,该 测度 与 被 研究 的 个 体 数 有 关 。 群体 内 遗 
传 变异 性 的 更 为 合适 的 斥 度 是 平均 期 望 杂 合 度 (expected heterozygosity) 或 基因 多 样 度 Cgene 


diversity) 。 该 尺 舌 多 态 性 的 武断 描绘 ,可 以 从 有 关 基 因 频 率 的 知识 中 直接 算出 ,并 且 受 取样 作 
用 的 影响 较 小 。 一 个 基因 座位 上 的 基因 多 样 度 定义 为 : 
h=1— 之 (2.19) 


这 里 x 是 等 位 基因 的 频率 而 mm 为 该 玄 基 因 座 位 上 等 位 基因 的 总 数 。 对 任 一 给 定 的 基因 座位 而 言 ,h 是 
随机 地 从 该 群体 中 选取 的 两 个 等 位 基因 互 不 相同 的 概率 .所 有 被 研究 过 的 基因 座位 的 h 值 的 平均 值 ， 
了 ,可 用 作 群 体内 遗传 变异 性 程度 的 一 种 估计 。 

基因 多 样 度 太 度 h 和 五 , 曾 被 广泛 用 于 电泳 数据 和 限制 酶 数据 。 不 过 ,它们 可 能 不 适用 于 DNA 


顺序 数据 ,因为 自然 界 中 DNA 水 平 上 的 遗传 变异 程度 是 相当 高 的 。 特别 地 , 当 所 考虑 的 序列 很 长 时 ， 


样本 中 的 每 一 序列 看 来 都 与 别 的 序列 有 一 个 或 多 个 核 苷 酸 的 差别 ， 在 大 多 数 情 况 下 h 和 H 都 将 接近 
于 1。 所 以 ,这 些 基 因 -多 样 度 太 度 将 无 法 区 别 不 同 的 基因 座位 或 群体 ， 也 不 再 是 多 态 性 的 信息 义 度 。 

对 于 DNA 顺序 数据 ， 关于 群体 中 多 态 性 的 更 合适 的 义 度 ,是 任意 两 个 随机 选取 的 序列 间 每 位 点 
的 平均 核 苷 酸 差异 数 。 该 尺度 称 核 苷 酸 多 样 度 Cnucleotide diversity) (Nei 和 Li,1979) ,用 天 表示 : 


区 一 0 。 [2 20) 


这 里 和 Ml x; 25) A DNA 序列 的 第 1 种 和 第 j 种 类 型 的 频率 ,而 DNA 序列 的 第 i 种 和 第 j 种 类 型 
间 不 同 核 苷 酸 的 比值 。 

目前 ,关于 DNA 序列 水 平 上 的 核 苷 酸 多 样 度 , 仅 有 为 数 不 多 的 一 些 研 究 。 这 类 研究 之 一 涉及 果 
ii D. melanogaster 的 乙醇 脱氧 酶 (Adh)? 基 因 座 位 。 路 越 Adh 区 域 的 11 个 序列 已 由 克 赖 特 曼 (Kreit- 
man,1983) 定 序 。 这 些 线性 排列 的 序列 长 达 2379 SRR. 如 果 不 管 缺失 和 插 人 , 则 有 9 个 不 同 的 等 
位 基因 ,其 中 一 个 由 3 个 序列 表示 ,而 其 余 的 则 各 由 一 个 序列 表示 (图 2 一 7)。 所 以 ,频率 xi 一 xs 各 为 
1/11， 而 频率 x, 为 3/11。43 个 核 苷 酸 位 点 是 多 态 性 的 。 首先 我 们 计算 每 对 等 位 基因 的 不 同 核 苷 酸 所 


点 的 比值 .例如 ,等 位 基因 1 一 S 和 2 一 S 在 2379 个 核 音 酸 中 相互 有 3 个 不 同 , 则 rs 一 0. 13%。 样 本 中 


所 有 等 位 基因 对 的 if ee 2 一 1。 由 等 式 2. 20, 估 出 核 苷 酸 多 样 度 为 r* 一 0. 007。 被 研究 的 等 位 基 
因 中 6 个 是 缓慢 移动 的 电泳 变异 型 (S),5 个 为 快速 移动 的 电泳 变异 型 (F)。S 和 开间 的 区 别 是 由 一 个 
BAERS. 结果 赋 于 蛋白 质 以 不 同 的 电泳 运动 性 所 造成 的 。 对 这 些 电泳 类 型 的 每 一 种 ,也 曾 分 别 地 
计算 了 它们 的 核 苷 酸 多 样 度 .我 们 得 到 :关于 S,x=0. 006; 关 于 F,r 王 0.003。 这 些 结果 指出 ,S 等 位 基 
因 的 多 态 性 是 F 等 位 基因 的 两 倍 。 


? 侧 序列 外 显 子 1 ASF 幼稚 前 导 外 显 子 2 ASF ， 外 显 子 3 内 含 子 加 ”外 显 子 4 FABRE 3 侧 序列 
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图 2 一 7 3D. melanogaster 的 乙醇 脱 氢 酶 基因 ,其 11 个 序列 中 的 多 态 性 核 苷 酸 位 点 。 只 有 那些 与 共同 顺序 有 
差异 的 地 方 被 显示 出 来 了 。 圆 点 表示 与 共同 顺序 相同 。 外 显 子 4 中 的 星 号 指示 赖 氨 酸 -对 - 苏 氨 酸 替 代 的 位 点 ,该 蔡 
代 是 两 电泳 型 等 位 基因 间 出 现 快 / 慢 运动 性 的 原因 。 自 Hartl 和 Clark(1989) 修改 而 成 。 
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表 2 一 1 RMD. melanogaster? 的 醇 脱 氢 酶 基因 座位 的 11 个 等 位 基因 中 > 


成 对 地 比较 的 百分比 核 背 酸 差异 
等 位 基因 
等 位 基因 
1S 25 3S 4S 5S 6S 7F 8F 9F 10F 
1-S 
ze 0.13 


3-S 0.59 0.55 

4-S 0.67 0.63 0.25 

5-5 0.80 0.84 0.55 0.46 

6-S 0.80 0.67 0.38 0.46 0.59 

7-F 0.84 0.71 0.50 0.59 0.63 0.21 

8-F 1.13 1.10 0-88 0.97 0.59 0.59 0.38 

9-F 1-13 1.10 0.88 0.97 0.59 0.59 0.38 0:00 

10-F 1.13 1-10 0.88 0.97 0.59 0.59 0.38 0.00 0.00 

11-F 1.22 1.18 0.97 1.05 0.84 0.67 0.46 0.42 0.42 0.42 


A Nei(1987). #48 Kreitman(1983). ‘ 
a. 加 以 比较 的 位 点 的 总 数 为 2379。S 和 下 分 别 表 示 缓 慢 和 快速 移动 的 电泳 型 等 位 基因 


2.7 新 达尔 文学 说 与 中 性 突变 假说 


达尔 文 提出 他 的 进化 学 说 根据 的 是 自然 选择 ,而 没有 关于 群体 中 变异 的 来 源 的 知识 。 备 德尔 定律 
被 重新 发 现 以 及 遗传 变异 被 证 明 是 由 突变 产生 的 之 后 ,达尔 文 主义 和 备 德 尔 主 义 被 用 作 后 来 被 称 为 


进化 的 综合 或 新 达尔 文 主义 Cneo 一 Darwinism ) 的 那 种 理论 的 框架 。 根 据 该 学 
说 ,虽然 突变 被 看 成 是 遗传 变异 的 根本 源 ,但 目 然 永 择 短 在 决定 群体 的 租 人 七 移 志 , 并 在 基因 替换 的 过 


程 中 、 着 FA. 

一 时 ,新 达尔 文 主义 成 了 进化 生物 学 中 的 法 则 ,而 选择 终于 被 看 成 是 能 驱动 进化 过 程 的 唯一 力 
量 。 其 他 因素 , 象 突变 和 随机 漂 变 , 被 认为 最 多 只 有 次 要 作用 。 新 达尔 文 主义 的 这 一 特殊 标记 称 为 选 _ 
择 主 义 (selectionism ) 。 

很 据 选择 论 者 或 进化 过 程 的 新 达尔 文学 派 的 观点 ,基因 替换 是 以 选择 对 有 利 突变 作用 的 结果 而 
出 现 的 。 另 一 方面 多 态 性 则 是 由 平衡 选择 来 维持 的 。 于 是 ,新 达尔 文 论 者 把 蔡 换 和 多 态 性 看 成 是 由 不 
同 的 进化 惫 量 驱 动 的 \ 丙 种 孤立 的 观 尔 ” 适 困 蕉 换 是 正 的 适应 性 过 程 的 最 后 结果 ,如 果 上 且 只 有 当 二 个 
新 的 等 位 基因 能 改善 该 生物 的 适合 度 时 , 它 才 会 经 此 过 程 而 占据 群体 的 以 后 世代 ;而 多 态 性 则 是 在 某 . 
一 基因 座位 上 两 个 或 更 多 个 等 位 基因 共存 对 该 生物 或 该 群体 有 利 时 , 才 被 维持 的 .新 达尔 文学 派 的 理 
论 主张 自然 界 中 大 多 数 遗 传 多 态 性 是 稳定 的 。 

十 九 世 纪 七 十 年 代 后 期 群体 遗传 学 中 出 现 了 一 次 革命 。 蛋 白质 顺序 数据 的 应 用 打破 了 群体 遗体 
学 研究 中 的 物种 界线 ,并 且 首 次 为 检验 与 基因 替换 的 过 程 有 关 的 学 说 提供 了 足够 的 经 验 数 据 ，1968 
年 ,木村 提出 ,进化 中 大 多 数 的 分 子 变化 是 由 于 中 人 性 或 近 中 性 突变 i wt 9 (Kimura, 


19 dL; King 和 Juges， 。 这 一 假说 ,现在 上 性 学 说 Cneutral theory of molecular 


evolution ) 而 著称 ,极力 主张 :分 子 水 平 上 的 大 多 数 进化 变化 以 及 物种 内 的 大 多 数 变异 性 , 既 不 是 由 有 
利 等 位 基因 的 正 选 择 也 不 是 由 平衡 选择 所 造成 的 ,而 是 由 选择 上 呈 中 性 或 近 中 性 的 突变 型 等 位 基因 


意 币 只 是 说 ,这 他 等 位 基因 的 命运 很 大 程度 上 是 由 随机 遗传 漂 变 所 决定 的 。 换 句 话说 ,选择 可 能 会 起 
E 用 ,但 它 的 强度 太 弱 以 至 于 不 能 抵消 机 遇 作用 的 影响 。 要 使 这 种 情况 成 为 事实 ,二 不 等 下 
择优 势 度 或 劣势 度 的 绝对 值 必须 小 于 1/(2Ne) ， e 为 有 效 群 体 大 小 。 

照 中 性 学 说 的 说 法 ,等 位 基因 的 频率 纯粹 由 随机 规则 所 决定 ,而 且 我 们 在 任 一 给 定时 刻 得 到 的 画 
面 都 只 是 一 种 瞬 态 , 它 代表 取 自 进行 着 的 动力 学 过 程 中 的 一 种 暂时 构造 。 因 此 ,多 态 性 基因 座位 是 由 
或 者 在 走向 固定 的 途中 、 或 者 将 要 灭绝 的 那些 等 位 基因 所 组 成 。 从 这 一 场景 来 看 ,与 进化 过 程 有 关 的 
所 有 分 子 的 表现 形式 ,都 应 被 看 成 是 突变 输入 和 与 之 相伴 的 等 位 基因 的 随机 灭绝 或 固定 的 某 一 连续 
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“过程 的 结果 。 故而 ,中 人 性 学 说 把 替换 和 多 态 性 看 成 是 同一 现象 的 两 个 侧面 。 替 换 是 一 个 长 期 而 渐进 的 


过 程 , 藉 此 突变 通 等 位 基因 的 频率 随机 地 增加 或 减少 ,直到 这 些 等 位 基因 最 终 困 机 遇 而 固定 或 丢失 。 
在 任何 给 定时 间 量 ; 某 亚 基因 座位 所 具有 的 等 位 基因 ,其 频率 将 既 不 是 0%% 也 不 是 100%%。 这 些 就 是 多 
态 性 的 基因 原 位 。 审 往 学 说 认为 ,群体 让 的 大 多 数 遗 传 多 态 性 在 自然 界 中 都 是 朋 时 的 。 

“下 入 论 者 和 选择 论 着 朵 季 证 酌 末 质 ,涉及 突变 型 等 位 基因 的 适合 度 值 的 分 布 问题 .两 种 学 说 都 认 
为 ,大 多 数 新 突变 是 有 害 的 并 且 它们 很 快 被 从 群体 中 清除 ,所 以 ,它们 对 替换 速率 和 群体 内 的 多 态 性 
的 量 都 没有 什么 贡献 。 不 同 的 是 ,关于 非 有 害 突变 中 中 性 突变 的 相对 比例 问题 。 选择 论 者 主张 很 少 的 
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ICES: scingrnmmpornnembeens 点 得 到 普遍 承认 .第 二 ,分子 生物 学 和 玫 
体 遗 传 学 间 综 合 ,通过 分 子 进 化 和 遗传 多 态 性 只 是 同一 现象 的 两 个 侧面 这 一 概念 的 导 和 人 ,而 大 大 加 强 
(Kimurra 和 Ohta,1971)。 虽 然 争论 仍 在 继续 ,但 任何 令 人 满意 的 进化 学 说 必须 与 分 子 水 平 上 进化 过 
程 的 这 两 个 方面 一 致 ,这 一 点 现在 已 得 到 承认 。 

在 一 系列 研究 中 , 根 井 等 (Nei 等 ,1978) 曾 从 这 一 观点 检验 过 中 性 突变 假说 。 最 近 , 赫 德 森 等 
(Hudson 等 ，1987) 曾 提出 过 一 种 方法 ,测试 由 种 间 DNA 顺序 比较 揭示 的 高 速 进化 着 的 DNA 区 域 ， 
是 否 象 中 性 突变 假说 所 预测 的 那样 ,在 物种 内 也 表现 出 高 水 平 的 多 态 性 。 


习题 


1. ASR 2.2 FHS 2.3. 

2. 如 果 A, MWA 是 完全 显 性 , 那么 等 位 基因 A. 的 每 世代 频率 改变 将 是 多 少 ? 

3. 从 等 式 2.4 导出 等 式 2.5 中 的 平衡 频率 。 

4. 给 定 一 个 由 5 个 两 倍 体 个 体 组 成 的 群体 ,其 中 Ai 的 频率 为 0.5, 且 A AA, 有 同样 的 适合 度 ， 
ABA ,在 下 一 世代 A, 的 频率 为 (a)0.0,(b)0.5, 或 (c)1.0 的 概率 各 为 多 少 ? 

5. 在 一 个 肉体 以 2 : 1 超过 雄性 的 群体 中 ,有 效 群 体 大 小 与 调查 统计 的 群体 大 小 的 比 是 多 少 ? 

6. 一 个 经 历 过 瓶颈 的 群体 ,比如 在 连续 6 个 世代 中 其 群体 大 小 为 :10、10、10'、10.10' 和 10'。 其 
长 期 群体 大 小 是 多 少 ? 

7. 在 一 个 有 效 群 体 大 小 为 100, 且 Ne=N 的 群体 中 ,一 个 具 0. 01 的 选择 劣势 度 的 新 突变 ,其 固 
定 概率 是 多 少 ? 

8. 应 用 图 2 一 7 中 的 序列 ,计算 等 位 基因 (a)1 一 S、 2 一 S 或 3 一 S 间 ,(b)1 一 S 和 7-F 间 ,编码 区 
〈 黑 长 方块 ) 中 的 核 背 酸 多 样 度 。 该 编码 区 长 771 个 核 苷 酸 。 
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3 核 音 酸 顺 序 中 的 进化 变化 


DNA 序列 进化 中 的 基本 形式 是 核 苷 酸 随时 间 的 改变 。 这 一 过 程 值得 详细 考虑 ,因为 核 苷 酸 顺 序 
中 的 变化 在 分 子 进 化 研究 中 , 既 用 来 估计 进化 的 速率 又 用 于 重建 生物 进化 的 历史 。 然 而 , 核 苷 酸 鞭 换 
的 过 程 通常 是 极其 缓慢 的 ,以 至 它 不 可 能 在 研究 者 所 生存 的 时 间 里 被 观察 到 。 因 此 ,为 了 检 出 DNA 
序列 中 的 进化 变化 ,我 们 依靠 比较 法 , 即 让 某 一 给 定 顺序 与 另 一 个 与 它 在 进化 上 过 去 有 共同 祖先 的 顺 
序 比较 。 这 种 比较 要 用 到 统计 学 方法 ,其 中 几 种 将 在 本 章 中 讨论 。 


3.1 DNA 序列 中 的 核 音 酸 蔡 换 


前 一 章 中 ,我 们 把 进化 过 程 描绘 成 一 系列 的 基因 替换 ,在 这 一 过 程 中 新 等 位 基因 以 单个 突变 的 形 
式 产 生 ,继而 增加 其 频率 ,最 终 则 在 群体 中 固定 。 现 在 我 们 从 不 同 的 观点 来 看 这 一 过 程 。 我 们 注意 到 ， 
要 被 固定 的 等 位 基因 其 顺序 不 同 于 它们 所 替代 的 等 位 基因 。 如 果 我 们 使 用 的 时 间 尺 度 中 一 个 时 间 单 
位 比 固 定时 间 长 ,那么 ,任何 给 定 基 因 座 位 上 的 DNA 顺序 都 将 表现 出 连续 变化 。 为 此 ,研究 一 下 一 个 
DNA 序列 中 的 核 苷 酸 如 何 随时 间 改 变 将 是 有 趣 的 。 象 以 后 我 们 要 解释 的 那样 ,这 一 研究 结果 可 被 用 
来 建立 估计 两 序列 间 蔡 换 数 的 方法 。 

为 了 研究 核 苷 酸 替 换 的 动力 学 ,我 们 必须 作出 几 项 关于 一 个 核 苷 酸 被 另 一 个 替换 的 概率 的 假定 。 
文献 中 已 提出 了 许多 这 样 的 数学 方案 。 我 们 将 把 讨论 仅 限 制 在 那些 最 简单 且 最 常用 的 方法 上 : 朱 克 斯 
Ail 4k 46 (Jukes 和 Cantor,1969) 的 一 参数 模型 (one-parameter model) 和 木村 (Kimura ,1980) 的 两 参数 
异型 (two-parameter model) 。 关 于 更 一 般 的 模型 的 评论 ,读者 可 参考 李 等 (Li 等 ,1985a) 的 论述 。 


朱 克 斯 和 坎 托 的 一 参数 模型 


朱 克 斯 和 坎 托 模型 的 替换 方案 如 图 3 一 1 所 示 。 该 模型 假定 蔡 换 在 4 种 核 苷 酸 类 型 中 随机 地 发 
生 。 换言之 ,在 变化 方向 上 没有 任何 倾斜。 例如 ,如 果 所 考虑 的 核 苷 酸 是 A, 则 它 将 以 相同 的 概率 改变 


Purines A G 


T 


Pyrimidines i 


a 
A3—1 MMAR -KURM, AMA PHF 6H HAIR F ABA a, 
MTC BG. 在 此 模型 中 , 对 每 种 核 苷 酸 来 说 , 蔡 换 速率 为 每 单位 时 间 Se, FL 3 种 可 能 的 变化 方向 中 
每 种 的 蔡 换 速率 都 是 w。 因 为 该 模型 只 涉及 一 个 参数 ,所 以 它 又 叫 一 参数 模型 
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我 们 假定 一 个 DNA 序列 中 某 一 位 点 上 座 落 的 核 苷 酸 在 时 刻 0 时 为 A。 首先 ,我 们 要 问 : 该 位 点 
在 时 刻 t 时 被 A 占据 的 概率 是 多 少 ? ”该 概率 用 Paw RA. 
因为 我 们 从 A 开始 ,所 以 该 位 点 在 0 时 刻 被 A SNR Pam=l. ENA 1, 该 位 点 上 仍 为 
A 的 概率 由 
Pa 一】 一 3c (3.1) 
给 出 , 它 反映 出 核 苷 酸 保持 不 变 的 概率 , 即 1 一 3a。 
在 时 刻 2 仍 有 A 的 概率 为 
Pag) = (1 — 3@)Paay + @L1 — Paay] (3. 2) 
Fy TF te SK , HE ATT BP YE) J TE: CK PR RS ABE A 2) KF BO MTC 或 G 但 随后 
又 回复 到 A( 图 3 一 2)。 在 时 刻 1 RBA A 的 概率 是 PAo ,而 在 时 刻 2 REA A 的 概率 是 1 一 3a。 这 
两 个 独立 变量 的 乘积 给 出 了 第 一 种 局 面 的 概率 , 它 构成 等 式 3. 2 NH. EMA RRA A 
的 概率 为 1 一 PAo ,而 在 时 刻 2 变 成 A 的 概率 为 w。 这 两 个 概率 的 乘积 给 出 了 第 艺 种 局 面 的 概率 , 它 即 


等 式 3. 2 中 的 第 2 项 。 mE 
局 面 工 Aw I 
t=0 A A 
不 替换 替换 
fel A 4E A 
不 替换 替换 
t=2 A A 


图 3 一 2 假定 在 时 刻 0 某 一 位 点 上 为 A, 而 在 时 刻 2 该 位 点 上 仍 有 A 的 两 种 可 能 的 局 面 。 
用 以 上 公式 ,我们 可 以 证 明 , 以 下 递 推 式 可 用 于 任何 的 ti: 


0 Sea) 
HEAT AT Ae SAT A Paw WE et BE SH 3. 3 ,为 : 
Paci — Paw Bre Sel se A a Bice) (3. 4a) 
或 
AP 4g) =— 3aPio + @01 — Paw) =— 40P aq + 4 (3. 46) 


至 此 我 们 考虑 的 是 一 个 离散 的 时 间 过 程 。 不 过 ,我 们 可 以 用 连续 时 间 模 型 来 近似 这 一 过 程 , 把 
APaA 看 成 是 时 刻 t 时 的 变化 率 。 以 这 一 近似 ,等 式 3. 4b 被 重 写 成 
dP aa) 


AO 一 一 4aPao +a (3.5) 
这 是 一 个 一 阶 线性 微分 方程 ,其 解 由 
Paw = < + aa He 7 (3. 6) 
给 出 。 因 为 我 们 从 A 开始 , 所 以 Pao=1l. Ki 
Pay => + Ge" (3.7) 


事实 上 ,等 式 3. 6 REHAB FMR. HM. BK ARE RAE A, Py... 0. iit 
在 时 刻 t 该 位 置 上 有 和 的 概率 为 


Pa oe a hie G | (3. 8) 
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等 式 3.7 和 3. 8 对 描绘 替换 过 程 来 说 是 充分 的 。 从 等 式 3. 7, 我 们 可 以 看 到 ,如 果 起 始 核 背 酸 是 
AIBA Paw Ht STH Rh A 1 降 到 1/4( 图 3 一 3)。 另 一 方面 ,从 等 式 3. 8 我 们 看 到 ,如 果 起 始 核 苷 酸 不 
是 A, 那 么 Pa 将 从 0 单调 地 上 升 到 1/4。 所 以 ,不 管 起 始 条 件 如 何 ,PAw 最 终 都 将 达到 174( 图 3 一 3)。 
这 对 工 C AG 而 言 也 是 正确 的 .因此 ,在 朱 克 斯 - 坎 托 模型 下 4 种 核 苷 酸 中 每 种 的 平衡 频率 都 是 1/4。 
达到 平衡 后 ,在 概率 上 将 没有 进一步 的 变化 , 即 , 对 所 有 t 都 有 Paw =Pr =Pom =Pow=1/4. AM, 
核 苷 酸 的 频率 仅 在 无 限 长 的 DNA 序列 中 保持 不 变 。 实 际 上 ,DNA 序列 的 长 度 是 有 限 的 ,所 以 核 苷 酸 
频率 上 的 波动 看 来 是 会 发 生 的 。 
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图 3 一 3 一 个 位 置 上 有 某 一 核 苷 酸 的 概率 随时 间 的 变化 :由 同样 的 核 音 酸 开 始 ( 上 线 ) 或 由 不 同 核 苷 酸 开始 (下 
线 )。 虚 线 表示 平衡 频率 (0. 25)。a 一 5X10“" 核 音 酸 /位 点 /年 。 

上 面 ,我 们 的 注意 力 集中 在 一 个 特定 的 核 苷 酸 位 点 上 ,而 把 Psw 处 理 为 一 种 概率 。 然 而 ,PE\v, 所 可 
被 解释 成 某 一 DNA 序列 中 A 的 频率 。 例 如 ,如 果 我 们 从 一 个 仅 由 腺 味 聆 构成 的 序列 开始 , 那 委 PAw 
=1, 而 PAw 则 是 在 时 刻 t 该 序列 中 A 的 期 望 频率 。 

MKB A 且 时 刻 t HRPM A 这 一 事实 考虑 进去 ,我 们 可 以 把 等 式 3.7 以 更 明确 
的 形式 重 写成 

Paaw = > + (Se (3. 9) 
如 果 起 始 核 苷 酸 是 G 而 不 是 A, 那 么 由 等 式 3. 8 我 们 得 
caw = + a (ess (3. 16) 


因为 在 朱 克 斯 - 坎 托 模型 下 所 有 核 苷 酸 都 是 等 价 的 ,所 以 Poa) =Poawy =Prawy. PLE RNTVEK 
一 个 一 般 性 的 概率 ,Pioo， 这 是 某 一 核 苷 酸 在 给 定 起 始 核 苷 酸 为 i 的 条 件 下 在 时 刻 t 变 为 j 的 概率 。 应 
用 这 个 一 般 化 了 的 概念 和 等 式 3. 9, 我 们 得 


Pia = + = (Bye (S39) 
且 由 等 式 3. 10; 
on 4 a Se (3. 12) 
ix iF}. 
木村 的 两 参数 模型 


象 朱 克 斯 和 坎 托 模型 那样 ,假定 所 有 核 苷 酸 蔡 换 随机 发 生 , 这 是 不 现实 的 。 例 如 ,转换 ( 即 A 和 G 

之 间或 C 和 T 工 之 间 的 变化 ) 一 般 比 颠 换 ( 即 所 有 其 他 类 型 的 变化 ) 更 频繁 一 些 ( 第 4 章 )。 考 虑 到 这 一 

事实 ,木村 (Kimura,1980) 曾 提出 一 个 两 参数 模型 ,如 图 3 一 4 所 示 。 在 此 方案 中 ,每 一 核 苷 酸 位 点 上 
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转换 型 替换 的 速率 为 每 单位 时 间 ,而 每 种 颠 换 型 蔡 换 类 型 的 速率 则 为 每 单位 时 间 B。 
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We ee C 


a. 
图 3 一 4 核 音 酸 蔡 换 的 两 参数 模型 。 在 此 模型 中 ,转换 的 速率 (a) 可 能 不 等 于 颠 换 的 速率 (B) 。 

该 模型 比 朱 克 斯 - 坎 托 模型 复杂 ,而 我 们 将 只 给 出 最 后 结果 。 从 等 式 3. 11 我 们 看 到 ,在 朱 克 斯 - 坎 
托 模型 中 , 某 一 位 点 上 在 时 刻 t 时 的 核 苷 酸 与 时 刻 0 时 的 相同 的 概率 ,对 4 种 核 苷 酸 来 说 是 相同 的 。 
即 ,PAAo 王 Pecuw 王 Po 三 Prro 。 由 于 替换 方案 的 对 称 , 这 种 等 同性 对 木村 的 两 参数 模型 也 是 成 立 的 。 

我 们 将 用 Xo 表 示 该 概率 。 可 以 证 明 : 
X@) = 4+ (Dew + (Sener (3.13) 
在 朱 克 斯 - 坎 托 模型 下 ,等 式 3. 12 不 管 从 核 苷 酸 1 到 核 苷 酸 j 的 变化 是 转换 还 是 颠 换 都 成 立 。 与 之 不 
同 ,在 木村 的 两 参数 模型 下 ,我 们 必须 对 转换 和 颠 换 两 种 变化 加 以 区 别 。 我 们 用 Yu 表示 起 始 核 苷 酸 


和 时 刻 t 时 的 核 苷 酸 经 转换 而 互 不 相同 的 概率 。 我 们 看 到 ,由 于 替换 方案 的 对 称 , 所 以 Yu 王 PAcou 二 
PeAo 王 Prco 王 Per 可 以 证 明 


Y() = + A (Fe Es (Ser (3. 14) 
HA hMRPRSRGRERAK-HREKRPHRRMAAA AY BR.Z.H FRA: 
Ape a “ (Pe (3. 15) 


注意 ,每 种 核 苷 酸 只 有 一 种 转换 类 型 ,但 却 经 受 着 两 种 类 型 的 颠 换 。 例 如 , 若 起 始 核 苷 酸 是 A, 那 
么 这 两 种 可 能 的 颠 换 变化 即 为 A~C 和 A-~TI。 因 此 ,起 始 核 背 酸 与 时 刻 t 时 的 核 苷 酸 经 两 种 颠 换 类 
型 之 一 的 变化 而 互 不 相同 的 概率 ,将 是 由 等 式 3. 15 给 出 的 概率 的 两 倍 。 还 要 注意 ,Xo 十 Yeo 十 2Zo 三 
ahs 


3.2 两 DNA 序 列 间 的 核 苷 酸 蔡 换 数 


一 个 群体 中 的 等 位 基因 替换 一 般 要 花 成 千 甚 至 上 百 万 年 来 完成 (第 二 章 ) 。 为 此 ,我 们 不 能 靠 直接 
观察 来 处 理 核 苷 酸 蔡 换 的 过 程 , 核 苷 酸 替 换 常 常 是 从 那些 有 共同 起 源 的 DNA 分 子 的 成 对 比较 中 推 
断 出 来 的 。 

两 个 核 苷 酸 序 列 相互 分 岐 以 后 ,每 一 个 都 将 积累 核 苷 酸 替 换 。 所 以 , 自 两 序列 发 生 分 岐 以 来 所 出 
。 现 的 核 苷 酸 蔡 换 数 , 就 是 分 子 进化 中 最 通常 用 到 的 变量 。 

当 两 核 苷 酸 序列 间 的 分 岐 程度 较 小 时 ,在 任 一 位 点 上 发 生 一 次 以 上 替换 的 机 会 可 以 忽略 , 则 两 序 
列 间 被 观察 到 的 差异 数 将 接近 实际 替换 数 。 另 一 方面 如 果 分 岐 程度 突出 ,那么 ,由 于 在 同一 位 点 上 的 
多 重 替 换 (multiple substitution ) 或 多 次 “ 击 中 ”(Cmultiple“hits”) ， 观察 差异 数 看 来 将 小 于 实际 替换 数 。 
例如 ,如 果 某 一 位 点 上 的 核 苷 酸 ,在 一 个 序列 中 从 A 变 到 C 再 变 到 下 ,在 另 二 个 序列 中 则 从 A 变 到 
T, 那 么 ,尽管 已 发 生 了 3 次 替换 ,但 两 序列 在 该 位 点 上 却 是 相同 的 (图 3 一 5) 。 文 献 中 已 有 几 种 修正 这 
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种 偏差 的 方法 被 提 了 出 来 。 
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图 3 一 5 来 自 一 个 祖先 序列 且 从 它们 开始 分 岐 时 起 累积 突变 的 两 个 同 源 DNA 序列 。 注 意 , 虽 然 已 经 累积 了 12K 
突变 ,但 可 被 检 出 的 差异 却 只 有 3 个 核 音 酸 位 点 。 再 注意 ,并 发 替换 ”, “平行 替换 ”, “趋同 替换 ”和 “回复 替换 ?, 都 
涉及 同一 位 点 上 的 多 重 替 换 , 虽 然 这 些 替换 可 能 发 生 在 不 同 的 品系 中 。 
替换 数 通 常 是 以 每 核 苷 酸 位 点 的 替换 数 的 形式 表示 ,而 不 是 以 两 序列 间 的 总 替换 数 表示 .这 有 利 
于 长 度 不 相同 的 序列 对 间 的 分 岐 程度 的 比较 。 
为 蛋白 质 编码 的 序列 和 非 编码 序列 应 分 别处 理 , 因 为 它们 通常 以 不 同 的 速率 进化 。 在 前 一 种 情况 
下 ,建议 将 同 义 蔡 换 和 非 同 义 替 换 加 以 区 别 , 因 为 已 知 它们 是 以 显然 不 同 的 速率 进化 着 的 (第 四 章 )。 
另 一 方面 ,在 非 编 码 区 , 则 可 假定 所 有 位 点 以 同样 的 速率 进化 。 


两 非 编 码 序 列 间 的 替换 数 


我 们 在 本 章 前 部 分 对 单个 DNA 序列 得 到 的 结果 ,可 用 于 研究 两 个 有 共同 起 源 的 序列 间 的 荒 音 
酸 分 岐 。 我 们 先 从 一 参数 模型 开始 。 在 该 模型 中 ,只 考虑 I w 就 够 了 。L ww 是 在 时 刻 t 某 二 给 定位 点 上 
的 核 昔 酸 在 两 个 序列 中 相同 的 概率 。 假 定 某 一 给 定位 点 下 的 筷 苷 酸 在 时 刻 0 是 A。 在 时 刻 t, 一 个 后 
代 序 列 在 该 位 点 上 有 A 的 概率 为 Ps ,因此 两 个 后 代 序 列 在 该 位 点 上 都 有 A 的 概率 则 为 Pswwz。 类 
似 地 ,两 个 序列 在 该 位 点 上 都 有 工 `.G BCG BY BERK APE Paro? Paco? Al Pscwz 因 此 ， 


Toy = Fase? + Parw? + Pacey? + Pac? (3.16) 4 


由 等 式 3.11 和 3.12, 我 们 得 
ee + ii (Se be (3.17) 
等 式 3.17 对 T.C 或 G 也 成 立 。 因 此 ,不 管 某 一 位 点 上 的 起 始 核 苷 酸 如 何 ,，I ,表示 从 上 时 间 单 位 
以 前 开始 分 岐 的 两 个 序列 间 相 同 核 昔 酸 的 比例 。 注 意 ,在 时 刻 t 两 序列 在 某 一 位 点 上 不 同 的 概率 为 卫 
Biel aw. ML, 


3 — gat 
oe Ale ) (3. 18a) 


或 
1 =P) (3. 18b) 
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两 序列 发 生 分 岐 的 时 间 通 常 是 未 知 的 ,这 样 我 们 就 不 能 估 出 c。 所 以 我 们 不 去 求 它 而 去 算 KK 
是 两 序列 间 自 分 岐 以 来 的 每 位 点 替换 数 。 在 一 参数 模型 的 情况 下 , 必 =2(3at) ,这 里 3at 是 两 个 品系 的 
每 一 个 中 每 位 点 的 替换 数 。 应 用 等 式 3. 18b ,我 们 可 算出 开 为 


2) Bat fis 
oe (3.19) 


其 中 了 是 两 序列 间 不 同 核 苷 酸 的 比例 (Jukes 和 Cantor,1969)。 对 于 长 为 工 的 序列 ,取样 方差 由 
P4l =P) 


VCRY = 
4 2 


(3. 20) 
近似 给 出 (Kimura 和 Ohta,1972). 

TE PS BO A GL FC BO 9 VY 2 Se BR PK eS eS A BP AQ 分 别 为 两 序列 间 
转换 型 和 颠 换 型 差异 的 比例 。 那 么 ,两 序列 间 核 苷 酸 蔡 换 数 天 ,由 
人 


天 到 方 名 (a) ae Fin) (3. 21) 


He fi th BB a= b= Tg. HRA MES 
V(K) = ajP +270 ie + cQ)? 
Ur 25 th. LH c= (atb)/2, iit L Wl Ay ix 2E Fe Pl AN KK BE (Kimura, 1980) 

让 我 们 来 考虑 一 个 假想 的 数字 例 , 设 长 为 200 的 两 个 序列 有 20 个 转换 和 4 个 颠 换 差 异 。 则 工 王 
200,P=20/200=0. 1,Q=4/200=0. 02. HEME MEH RNA :a=1/(1—0. 2—0. 02) = 1. 28,b 
=1/(1—0. 04)=1. 04, K=(1/2)InQ1. 28) + 1/4)In(1. 04) 0.13. FRART HWA SRK 
K, RUM RR LORE. 在 此 例 中 ,从 两 序列 间 的 24 FER ,我们 得 到 一 个 约 为 26 次 替换 的 估 值 。 按 
照 一 参数 模型 ,p 一 24/200 王 0. 12 和 开 0. 13。 于 是 ,用 一 参数 模型 ,我 们 达到 了 与 两 参数 模型 情况 一 
样 的 结果 。 

上 例 中 两 种 模型 基本 上 给 出 了 同样 的 估 值 ,这 是 因为 岐 化 程序 低 , 以 至 修正 后 的 岐 化 度 ( 玫 =0. 
13) 只 略 大 于 未 经 修正 的 值 (p 王 24/200=0. 12) 的 缘故 .在 这 样 的 情况 下 ,我 们 可 用 较 简 短 的 朱 克 斯 和 
坎 托 的 模型 。 

当 两 序列 间 的 岐 化 度 较 大 时 ,由 两 种 模型 得 出 的 估 值 就 可 能 差异 显著 。 例 如 ,两 个 具 工 一 200、 相 
EA 50 个 转换 和 16 个 颠 换 差 异 的 序列 ,有 p=—50/200=0. 25,Q=16/200=0. 08。 按 两 参数 模型 ,我 
们 有 a=2. 38,b=1.19 及 ks0.48。 而 根据 一 参数 模型 ,p 一 66/200=0. 33, MA K~0.43, WM, HR 
参数 模型 K 的 估 值 小 于 用 两 参数 模型 得 到 的 估 值 。 当 两 序列 间 的 岐 化 度 较 大 、 且 特别 地 在 有 预先 存 


22) 


在 的 原因 相信 转换 的 速率 与 颠 换 速率 很 不 一 样 的 情况 下 ,两 参数 模型 看 来 比 一 参数 模型 更 精确 。 


两 个 为 蛋白 质 编码 序列 间 的 蔡 换 数 


在 研究 为 蛋白 质 编码 序列 中 ,我们 通常 将 起 始 和 终止 密码 子 排除 在 外 ,因为 这 两 个 密码 子 几 乎 不 
随时 间 而 变 。 

为 了 分 别处 理 同 义 蔡 换 和 非 同 义 蔡 换 , 我 们 首先 要 把 余下 的 核 童 酸 位 点 按 以 下 方式 分 类 :考虑 一 
个 密码 子 中 的 菜 一 特别 位 置 。 设 i 为 该 位 点 上 可 能 的 同 义 变化 数 ， 那么 该 位 点 被 算 作 瑟 同 义 的 和 
非 同 义 的 。 例 如 ,在 密码 子 TTTCPhe) 中 ,最 初 两 个 位 置 被 算 作 非 同 义 的 ,因为 在 这 两 个 位 置 上 不 发 生 
同 义 变化 ;而 第 3 位 被 算 作 三 分 之 一 同 义 的 和 三 分 之 二 非 同 义 的 ,因为 该 位 置 上 三 种 可 能 的 变化 中 
有 一 种 是 同 义 的 。 另 一 个 例子 ,密码 子 ACT(Thr) 有 两 个 非 同 义 位 点 (前 两 个 位 置 ) 和 一 个 同 义 位 点 
(第 3 位 ), 因 为 前 两 位 上 所 有 可 能 的 变化 都 是 非 同 义 的 ,而 第 3 位 上 所 有 可 能 的 变化 都 是 同 义 的 。 在 
比较 两 个 序列 时 ,我 们 先 要 算出 每 一 序列 中 同 义 位 点 的 数目 和 非 同 义 位 点 的 数目 ,然后 计算 这 两 个 序 
列 间 的 平均 值 。 我 们 用 Ns 表示 同 义 位 点 的 平均 数 ,用 NA 表示 非 同 义 位 点 的 平均 数 。 

其 次 ,我 们 把 核 苷 酸 差异 分 成 同 义 的 差异 和 非 同 义 的 差异 两 类 。 对 于 只 有 一 个 核 苷 酸 差异 的 两 个 
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密码 子 ,这 种 差异 很 容易 判断 。 例 如 ,GTC(Val) 和 GTT(Val) 这 两 个 密码 子 间 的 差异 是 同 义 的 ,而 
GTC(Val) 和 GCCCAla) 这 两 个 密码 子 间 的 差异 则 是 非 同 义 的 .对 于 有 不 止 一 个 核 苷 酸 差异 的 两 个 密 
码 子 ,我 们 必须 考虑 导致 该 观察 到 的 变化 的 所 有 可 能 的 进化 途径 。 例 如 对 AAT(Asn) 和 ACG(THr) 
这 两 个 密码 子 , 即 有 两 种 可 能 的 途径 ， 

途径 | :AAT(CAsn)*>ACT(Thr)e>ACGCThr) 

& 1 : AAT(Asn)AAG(Lys)«*ACG (Thr) 

途径 1 需要 一 次 同 义 变化 和 一 次 非 同 义 变化 ,而 途径 工 则 需要 二 次 非 同 义 变化 .已 知 同 义 蔡 换 远 
比 非 同 义 替 换 发 生得 频繁 (第 四 章 ) ,所 以 我 们 可 以 假定 途径 I 比 途 径 1 ers 
我 们 假定 途径 | 的 权重 为 0. 7 而 途径 工 的 权重 为 0. 3, 那 么 两 密码 子 间 呵 义 的 差异 数 估计 为 0.7X1 
十 0.3X0 王 0.7, 而 非 同 义 的 差异 数 为 0.7X1 十 0.3X2=1.3。 这 里 所 用 的 权重 是 假设 的 。 对 所 有 可 能 
的 密码 子 对 的 权重 作 经 验 性 的 估计 ,富田 和 安永 (Miyata 和 Yasunaga,1980) 曾 根据 蛋白 质 顺 序数 据 
作出 , 李 等 (Li 等 ,1985b) 则 根据 DNA 顺序 数据 而 得 到 。 如 果 我 们 假定 两 种 途径 可 能 性 相同 ;那么 ,上 
例 的 非 同 义 差异 数 为 (L 十 2)/2 一 1. 5, 而 同 义 差异 数 则 为 (1 十 0)/2=0.5。 可 见 , 加 权 法 和 非 加 权 法 可 
能 会 给 出 有 点 不 同 的 结果 。 实 际 上 ,两 种 方法 的 估 值 间 的 差异 一 般 较 小 (Nei 和 Gojobori, 1986) ,但 对 
于 那些 高 度 保守 的 蛋白 质 , 如 组 蛋白 和 肌 动 蛋白 ,对 编码 的 基因 而 言 它们 可 能 非常 重要 (Li 等 ， 
1985b) 。 用 任何 一 种 方法 ,我 们 都 能 估 出 两 编码 序列 间 的 同 义 差 异 数 (Ms) 和 非 同 义 差异 数 (MA)。 

从 以 上 结果 我 们 可 以 用 ps=MSs/Ns 算出 每 同 义 位 点 的 同 义 差 异 数 ,并 用 pp =Ma/Na 算出 每 非 
同 义 位 点 的 非 同 义 差异 数 。 这 些 公式 显然 没有 把 同一 位 点 上 多 次 击 中 的 效应 考虑 进去 。 我 们 可 用 朱 


克 斯 和 坎 托 的 公式 : 
ees £. AMs 
K,=— {1 3Ns} (3.23) 
和 
3 AM, 
K,=— {ln i ox | (3. 24) 
来 做 这 样 的 修正 。 


一 种 可 采用 的 处 理 编码 区 的 方法 是 ,把 核 苷 酸 位 点 分 成 非 简 并 的 (nondegenerate)， 两 重 简 并 的 
(twofold degenerate) fll Pa & fai 3# 9 (fourfold degenerate) {ii A (Li 等 ,1985b) 。 如 果 一 个 位 点 上 所 有 可 
能 的 变化 都 是 非 简 并 的 , 则 该 位 点 是 非 简 并 的 ;如 果 三 种 可 能 的 变化 中 一 种 是 同 义 的 , 则 该 位 点 是 两 
重 简 并 的 ;如 果 所 有 可 能 的 变化 都 是 同 义 的 , 则 该 位 点 即 为 四 重 简 并 的 。 例 如 ,密码 子 TIT(Phe) 的 前 
两 位 是 非 简 并 的 ,而 第 3 位 则 是 两 重 简 并 的 ( 见 第 一 章 中 的 表 1 一 1)。 相 比 之 下 ,密码 子 GTT(Val) 的 
第 3 位 是 四 重 简 并 的 。3 个 异 亮 氨 酸 密 (lle) 码 子 中 的 第 3 位 被 简化 处 理 成 两 重 简 并 位 点 ,尽管 事实 上 
该 位 置 上 的 简 并 是 三 重 的 。 在 哺乳 动物 的 线粒体 基因 中 ， 异 亮 氨 酸 只 有 两 个 密码 子 , 所 以 其 第 3 位 事 
实 上 就 是 两 重 简 并 位 点 ( 见 第 一 二 的 委 工 二 37 

将 核 苷 酸 位 点 经 上 述 分 类 分 成 各 种 简 并 美 型 (degeneracy « classes) 之 后 ,我 们 即 可 对 这 3 类 位 点 分 
别 计算 两 编码 序列 间 的 替换 数 。 注 意 ,根据 定义 所 有 非 简 并 位 点 上 的 替换 都 是 非 同 义 的 。 类 似 地 ,所 
有 四 重 简 并 位 点 上 的 替换 都 是 同 义 的 。 在 两 重 简 并 位 点 上 ,转换 型 变化 (Ce>*T 和 Ac>*G) 是 同 义 的 ,而 
所 有 其 他 变化 , 即 颠 换 型 变化 ,都 是 非 同 义 的 。 在 哺乳 动物 线粒体 的 遗传 密码 里 ,此 规则 一 无 例外 。 另 
一 方面 ,在 通用 的 细胞 核 遗 传 密码 中 , 却 有 两 个 例外 : 精 氨 酸 密码 子 (CGA 和 AGA,CGG 和 AGG) 
第 1 位 ,其 上 的 一 种 颠 换 型 变化 是 同 义 的 ,而 其 他 类 型 的 颠 换 和 所 有 转换 都 是 同 义 的 ;以 及 3 个 异 亮 
氨 酸 密 子 (AUU AUC 和 AUA) 中 的 最 后 一 位 也 是 如 此 。 

根据 两 种 方法 计算 替换 速率 的 计算 机 程序 可 由 作者 提供 , 若 需 要 ,请 寄 一 个 格式 化 了 的 TBM PCa 
三 兼容 软磁盘 来 拷贝 。 


3.3 ， 核 背 酸 序列 和 氨基 酸 序列 的 线性 排比 


两 不 同 源 序 列 的 比较 涉及 对 缺失 和 插入 位 置 的 鉴别 问题 ,因为 两 个 品系 从 其 共同 祖先 分 玻 演 化 时 
. 34 * 


eis sn eet itt steer digmnclit mA DNA 
FF Ba Be A LE ARE RRA IE A he 7 RE — PET A 
We» BF 8 FE BR 

虽然 我 们 是 用 DNA 序列 来 说 明 线 性 排比 的 过 程 ,但 同样 的 原则 和 程序 也 可 用 于 氨基 酸 序列 的 
排比 。 事 实 上 ,用 氨基 酸 顺序 与 用 DNA 顺序 比 起 来 ,前 者 通常 能 得 到 更 可 靠 的 线性 排比 

线性 排比 由 一 系列 成 对 的 碱 基 组 成 ,其 中 每 一 个 碱 基 各 来 自 一 个 序列 .有 3 种 线 列 的 对 ,(1) 匹 本 
的 大 基 对 ,(2) 匹 配 错误 的 碱 基 对 ,和 (3) 由 来 自 一 个 序列 的 碱 基 与 另 一 序列 的 空缺 碱 基 Cnull base) 组 
成 的 对 子 。 空 缺 碱 基 用 表示。 一个 匹配 的 对 子 表示 一 个 自 两 序列 分 坡 以 来 没有 发 生变 化 的 位 点 ，_ 
个 匹配 错误 的 对 子 表示 一 次 替换 ,而 一 个 空缺 对 子 则 表示 ,在 这 两 个 序列 之 一 的 该 位 置 上 曾经 发 后 过 
一 次 缺失 或 者 插入 。 

考虑 两 DNA 序列 A 和 B, 其 长 度 分 别 为 m 和 nm 的 例子 。 如 果 我 们 用 x 表示 匹配 的 对 子 数 ,用 Y 
表示 匹配 错误 的 对 子 数 ,而 用 z 表示 含有 一 个 空缺 碱 基 的 对 子 数 , 则 我 们 有 ， 

1 十 Mi 一 2(z 十 y) 十 > (au Z) 


点 阵 法 


当 只 有 少数 裂缝 上 且 两 序列 在 其 他 任何 方面 差异 都 不 太 大 时 ,一 种 合理 的 线性 排比 可 以 由 视觉 观 
察 得 到 ,或 者 也 可 用 被 称 为 点 阵 法 (dot matrix method) 的 方法 得 到 。 在 此 法 中 ,被 线 排 的 两 个 序列 作 
为 一 个 和 矩阵 的 首 列 和 首 行 而 写 出 (图 3 一 6)。 在 两 序列 中 核 苷 酸 相同 的 矩阵 位 置 处 记 上 圆 点 。 如 果 两 
序列 等 同 ,那么 该 矩阵 对 角 线 上 的 所 有 元 素 都 将 是 圆 点 (图 3 一 6a) 。 如 果 两 序列 有 差异 但 可 被 无 裂 颖 
地 线 排 , 则 对 角 线 元 素 的 大 多 数 是 圆 点 (图 3 一 6b) 。 如 果 两 序列 之 一 中 出 现 一 个 裂 矣 , 则 线性 排比 的 
对 角 线 将 垂直 或 水 平地 移动 (图 3 一 6c)。 如 果 两 序列 间 的 差异 既 有 裂缝 又 有 替换 (图 3 一 6d) , 则 找 出 
裂 锋 的 位 置 并 从 犯 种 可 能 的 线性 排比 中 挑 出 一 种 可 能 是 很 困难 的 。 在 这 样 的 情况 下 ,视觉 观察 和 点 阵 


法 就 不 可 靠 了 ,而 为 了 得 到 客观 的 线性 排比 已 有 几 种 计算 方法 被 提出 来 了 
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组 成 。 途 径 2 含 有 8 个 对 角 线 步骤 ,其 中 2 个 是 空格 ,和 1 个 水 平 步 骤 。 途 径 1 MRAZ MHARED MY TAR 
定 , 即 根据 哪 种 进化 序列 更 有 可 能 :一 次 两 核 昔 酸 缺 失 ( 途 径 1) 或 一 次 一 核 苷 酸 缺 失 和 两 次 替换 (途径 2) 来 决定 。 
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顺序 一 距离 法 


两 序列 间 最 为 可 能 的 线性 排比 是 ,根据 某 种 标准 使 线 列 中 匹配 错误 和 有 裂缝 的 数目 最 小 的 那 种 。 不 
幸 地 是 ,降低 匹配 错误 数 结 果 常 会 导致 裂缝 数 增加 ,反之 亦 然 。 

例如 ,考虑 以 下 两 个 序列 : 

A:TCAGACGATTG (m=11) 

B:TCGGAGCTG (n= 9) 
我 们 可 按 如 下 排比 将 匹配 错误 数 降 到 和 零 ; 


全 一 ACUTE 
ORG 人 人 一 全 (人 


在 这 种 情况 下 裂缝 数 为 6。 反之 , 裂 矣 数 可 降低 到 由 |m 一 n| 个 核 苷 酸 组 成 的 一 个 裂 颖 ,结果 匹配 
错误 数 却 增加 了 : 
(1) TCAGACGATTG 
TCGGAGCTG— — crn 
在 这 种 情况 下 ,我 们 只 有 一 个 位 于 末端 ,因而 也 是 不 可 避免 的 裂缝 ,但 匹配 错误 (用 星 号 标 出 ) 的 数目 
却 为 5。 
或 者 ,我 们 可 以 选 一 个 裂 颖 数 和 替换 数 都 不 是 最 小 的 线性 排比 。 例 如 ， 


(1) TCAG—ACGATTG 
TC—GGA—G CG 


在 这 种 情况 下 匹配 错误 数 是 2, 裂 颖 数 为 4。 
那么 ,这 3 种 线性 排比 中 哪 一 种 最 可 取 ? 显 然 , 将 蔡 换 与 裂缝 比较 就 好 象 将 芋 果 和 桔子 比较 一 样 。 
所 以 ,我 们 必须 找到 一 个 共同 标准 , 藉 此 来 比较 裂 颖 和 替换 。 [ri] ty HE BK PK Ay Fe SE Ab Fi] (gap 
penalty) 。 
有 几 种 指定 裂 矣 处 罚 的 系统 .所 有 系统 都 是 在 相对 于 点 状 的 替换 .缺失 和 插 人 出 现 的 频繁 程度 如 
何 , 这 类 问题 的 预先 理解 的 基础 上 建立 的 。 在 第 1 个 系统 中 , 裂 颖 的 总 长 度 (z) 用 恒定 的 裂 笑 处罚 Cw) 
来 乘 。 该 系统 背后 的 假定 是 ,有 某 一 裂 妖 的 概率 反比 于 裂缝 的 大 小 。 举 例 说 来 ,有 一 个 由 两 核 苷 酸 组 
成 的 裂 颖 的 概率 ,与 有 两 个 各 由 一 核 苷 酸 构成 的 裂 颖 的 概率 相同 .这 样 , 对 任何 线性 排比 ,我 们 都 能 用 
D= y+ wz (3. 26) 
来 计算 两 序列 间 的 距离 尺度 (D)。 
在 第 2 种 处 罚 系统 中 ,我们 假定 长 的 缺失 和 插入 在 进化 中 与 短 的 比较 ,出 现 的 可 能 性 是 不 同 的 。 
在 这 种 情况 下 ,对 不 同 长 度 裂 颖 的 处 罚 可 能 正比 于 裂 颖 长 度 也 可 能 并 非 如 此 。 根 据 这 一 系统 ,与 某 一 
特定 线性 排比 有 关 的 距离 尺度 是 
D=y+ Dj wer (3. 27) 
其 中 ,zk ZEKE K Bt wk WE RA OK 的 裂 颖 的 处 罚 。 
现在 让 我 们 用 有 w=2 的 第 1 个 系统 来 比较 线性 排比 1,I 和 HE。 得 到 的 距离 (D) ,对 线性 排比 
1,0 AM AHA 0+ (2K 6)=12,54+ (2X2) =9,M 2 十 (2X4) 王 10。 我 们 将 选取 线 排 工 。 如 果 我 们 
用 有 wi=2 Aw.-6 的 第 2 个 系统 , 则 了 的 值 结 果 对 工 工 和 开 分 别 为 12,11 和 10。 在 这 种 情况 下 ， 
HK THE LAG HE MM 
任何 线性 排比 算法 的 目的 ,都 是 从 所 有 可 能 的 线性 排比 中 ,选取 具有 最 小 D 值 的 那 种 线性 排比 。 
在 最 和 常 应 用 的 方法 中 ,有 尼 德 尔 曼 与 文 施 (Neeldleman 和 Wunsch,1970) 法 ,和 塞 勒 斯 (Seller,1974) 
法 . 在 前 一 种 方法 中 ,两 序列 间 的 类 似 性 (similarity) 用 类 似 指 数 (Csimilarity index) 来 测度 ,而 具 最 大 
类 似 性 的 那 种 线性 排比 将 被 从 所 有 候选 者 中 选取 出 来 。 在 塞 勒 斯 法 中 ,两 序列 间 的 不 相似 性 (dissimi- 
larity) 用 距离 指数 (distance index) 来 测度 , 具 最 小 距离 的 那 种 线性 排比 将 被 选 出 。 这 两 种 方法 曾 被 证 
明 在 某 些 条 件 下 是 等 价 的 (Smith 等 ,1981) 。 
在 必须 从 许多 线性 排比 中 选 出 一 种 时 ,寻找 最 佳 排比 的 任务 若 无 计 算 机 的 帮助 常常 难以 完成 。 在 
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尼 德 尔 曼 与 文 施 (Needleman 和 Wunsch,1970) 算 法 或 其 修订 法 的 基础 上 ,已 有 许多 关于 线 排 顺 序 的 
常用 计算 机 程序 建立 起 来 。 

要 记 住 的 最 重要 的 一 点 是 ,作为 最 后 结果 的 线性 排比 常 有 赖 于 裂 矣 处 罚 的 选取 ,而 后 者 又 有 赖 
于 ,相对 于 点 替换 的 频率 裂缝 事件 在 DNA 和 有 蛋白质 进 化 中 的 频率 究竟 是 多 少 的 这 样 一 些 关键 的 假 
ye wa 


3.4 核 苷 酸 替 换 数 的 间接 佑 计 


在 估计 两 序列 间 核 苷 酸 蔡 换 数 方面 ,最 完全 的 解决 可 通过 比较 它们 的 核 苷 酸 顺 序 而 得 到 。 不 过 ， 
蔡 换 数 也 可 从 其 他 类 型 的 分 子 数 据 ,象限 制 酶 图 谱 或 者 DNA 一 DNA 杂交 得 到 的 数据 间接 地 推断 出 
来 。 


限制 性 核酸 内 切 酶 片段 模式 和 位 点 图 谱 


限制 性 核酸 内 切 酶 (restriction endonucleases) 或 限制 酶 (restriction enzymes) 能 识别 被 称 为 识别 顺 
FF (recognition sequences) 的 特殊 双 链 ':DNA 序列 ,并 在 识别 顺序 上 或 其 近 旁 切 开 该 DNA。 识别 顺序 通 
常 长 为 4 或 6 碱 基 对 ,它们 中 许多 都 是 回 文 ( 即 它们 是 旋转 对 称 的 )。 识 别 顺序 可 能 是 唯一 的 (例如 
EcoRI) ,也 可 能 不 是 唯一 的 (例如 Hind I 工 )( 见 表 3 一 1) 。 切 点 称 为 拼接 位 点 (splicing site) 或 限制 位 点 
(restriction site) 。 许 多 限制 性 内 切 核酸 酶 以 一 种 错开 的 方式 切 开 双 链 DNA, 所 以 将 产生 “粘性 末端 ” 


(sticky ends) ,以 后 它们 可 在 连接 酶 (ligase) 的 作用 下 相互 连接 (ligated)。 这 就 是 为 什么 限制 酶 能 在 遗 


传 工 程 中 成 为 一 种 极 有 用 的 工具 的 原因 。 表 3 一 1 列 出 了 几 种 限制 酶 的 识别 顺序 和 拼接 位 点 。 
表 3 一 1 几 种 限制 性 核酸 内 切 酶 的 识别 顺序 和 切 点 


酶 ‘ 识别 顺序 (RS) 切割 
识别 位 点 A SS. ee 
CAE BD 2K WR) 大 小 不 确定 性 回 文 “邻接 在 RS 中 错开 式 
EcoR | 1_¢ 2A Aree 
5) —G-LA—A- eer 03 P ~~ . . / ae 

(Escherichia coli) 3 —C —T eee 
Hind I 5 —G—T —Py Y py—A—c—3' 

6 Se 4p oH oe = 
(Haemophilus influenzae) 3'—C—A—Pu ah 1 7G8 
Hae I 5'—G—=G 4+ c—c-3 

4 = 半 + 起 = 
(Haemophilus aegy ptus) eee Oe 4S Sx BY 
Bbv I 5 —G—CH AG eens! 

$ = “= ete = 5 
(Bacillus brevis) GT 人 
Nei I 5 CG + c/G—G—G—3! 

5 25 + 中 下 
(Neisseria cinerea) 3 —G—G_—G/e we wept 
Not I 5 —G=C + ¢-—G—c—c—G—c-3' 

8 = 十 + +t 7 
(Nocardia otitidis-caviarum) 3’—_C—G—C—C—G—G mee 
Hinf | 5! —G Aa ae 

4 = =: = i ar 
(Haemophilus influenzae) 3’—-C—T—N—-A-=G—5' 


A 

a\ 识 别 顺序 用 黑体 字母 表示 .。 切 点 用 箭头 指出 .不 确定 的 地 方 , 象 Pu: 味 叭 ;Py: 喀 喧 ;C/G:C 或 G;N: 任 何 核 苷 酸 。 
Nn 表示 由 mn 个 任意 的 核 苷 酸 组 成 的 序列 。 

当 一 个 双 链 的 DNA 片段 受到 水 解 时 , 即 有 各 种 不 同 长 度 的 片段 产生 出 来 。 它 们 可 因 其 各 自 的 长 
度 而 在 电泳 凝 胶 上 分 开 , 因 为 在 凝 胶 上 较 短 的 片段 比较 长 的 要 跑 得 更 快 也 移动 得 更 远 。 通 过 用 已 知 长 
度 的 DNA 片段 作 基准 ,限制 性 片段 的 长 度 即 可 被 估计 出 来 。 不 同 的 DNA 序列 根据 其 识别 位 点 的 数 
目 和 位 置 的 差异 而 受到 限制 酶 的 不 同 切 割 。 a -个 DNA 序列 水 解 产 生 的 片段 的 数目 和 大 小 被 称 为 
限制 片段 模式 (restriction-fragment pattern) 。 连 续 而 交互 地 应 用 几 种 能 将 DNA 水 解 成 重 友 片 段 的 限 
制 酶 ,常常 可 推断 出 DNA 上 限制 位 点 的 大 概 位 置 ( 图 3 一 7)。 表 示 某 一 DNA 序列 上 限制 位 点 的 位 置 
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的 方案 图 称 限 制图 谱 (restriction map ) 。 

应 用 限制 酶 来 推断 两 序列 间 的 替换 数 ,其 背后 的 理由 是 ,两 DNA 序列 的 类 似 性 越 大 则 其 限制 片 
段 模式 就 越 相 似 。 通 过 对 DNA 序列 内 限制 位 点 的 分 布 作出 某 些 假 定 , 例 如 , 象 4 种 核 苷 酸 有 相同 的 
频率 以 及 它们 在 序列 中 的 空间 分 布 是 随机 的 ,这 样 的 假定 , 则 从 限制 位 点 数据 就 可 以 对 DNA 序列 间 
限制 模式 方面 的 进化 变化 进行 研究 ,从 而 估计 出 每 位 点 的 核 苷 酸 替 换 数 (K)。 

首先 ,我们 考虑 从 限制 片段 模式 来 估计 开 。 从 共有 片段 数 来 估计 K ,要 求 我 们 对 由 限制 性 核酸 内 
切 酶 水 解 的 DNA 的 电泳 模式 进行 直接 比较 .这 里 提供 的 方法 是 由 根 井 和 李 (Nei 和 Li,1979) 创 导 的 。 
文献 中 曾 报导 过 另外 两 种 方法 (Upholt,1977;Engels,1981la) ,而 卡 普 兰 (Kaplan,1983) 曾 证 明了 这 3 


种 方法 给 出 类 似 的 结果 。 
DNA 的 两 序列 间 共 有 DNA 片段 的 期 望 比例 IF) ,可 由 
A 2mxy 
f= tn (3. 28) 


来 估计 ,其 中 mx 和 my APE AES X ALY 7K RG Pe AE AY Bl BE BC. Oxy J Je BB SEAR BY 
片段 数 。 
根 井 和 李 (CNei 和 Liy,1979) 曾 证 明 , 共 有 片段 的 期 望 比例 (FE) 可 用 在 t 时 间 内 某 一 限制 位 点 保持 
不 变 的 概率 (G) 来 表示 ,两 者 之 间 的 近似 关系 为 
Fr soz 
Ge ™G yr BA Ae ETE A EAE YP td 
Bt fe}, 3c 26 FF fe) EA ABO K=2at. WT GRIM KHER 3. 29,8 
G = (F(3 一 2G)]1 (3. 30) 
Wr AT at — 7 ER A. ABE (Nei, 1987) 建议 用 G=F2 作 为 最 初 尝试 值 . 一 般 只 需要 
很 少 几 次 反复 循环 。G 的 估 值 可 使 我 们 得 到 KK 的 估 值 ,关系 如 下 : 


aes = in(G) (3. 31) 


(3. 29) 


让 我 们 来 考虑 下 面 这 样 一 个 例子 : 取 自 两 种 野生 小 麦 (4egiiozs sharonensis 和 Ae. bicornis) 1) FAM 
线粒体 DNA 片段 ,用 3 种 限制 酶 ,Ba 1, Hind I fl EcoRI 来 水 解 ,它们 的 识别 顺序 都 为 6 碱 基 对 
长 (数据 自 Graur 等 ,1989a) 。4e. sharonensis 水 解 产 生 4 个 片段 ,而 Ae. bicornis 水 解 则 产生 5 个 片段 。 
两 个 片段 为 两 种 小 麦 所 共有 。 用 等 式 3. 28 ,我 们 估 出 下 为 2/9 王 0. 222。 现 在 我 们 可 以 开始 由 等 式 3. 
30 给 出 的 反复 尝试 过 程 。 我 们 采用 的 G HAW 0. 222'*=0. 687. 第 一 次 循环 后 我 们 得 G=0.775， 
而 下 一 次 循环 G=0.753。 随 着 尝试 的 进行 摆 幅 将 越 来 越 小 ,而 在 弟 5 次 和 第 6 次 循环 后 我 们 都 得 到 
G=0.758。 因 此 ,我们 终止 反复 尝试 过 程 。 为 了 得 到 两 序列 间 替 换 数 的 估 值 ,我 们 用 等 式 3. 31。 最 后 
结果 是 ,两 线粒体 序列 的 相互 差异 用 每 核 苷 酸 位 点 替换 数 K=0. 092 来 估计 。 

现在 我 们 考虑 由 限制 位 点 图 谱 估计 两 序列 间 的 核 苷 酸 替 换 数 .在 前 面 的 例子 中 ,限制 位 点 的 位 置 
是 未 知 的 。 如 果 限 制 位 点 已 在 DNA 序列 上 定位 ,那么 ,我 们 可 以 直接 从 图 谱 上 找 出 共有 和 非 共有 的 
位 点 ,并 估 出 替换 数 。 设 mx 和 my 分 别 为 DNA 序列 X 和 了 中 限制 位 点 的 数目 ,而 mxv 为 两 序列 间 共 
有 的 限制 识别 位 点 数 。X 和 在 某 一 给 定位 点 上 共有 同样 的 识别 顺序 的 概率 用 S 表示 ,此 值 可 用 


2772Xy 


二 mx + my (3432) 
估 出 (Nei Al Li,1979), RARER KH H.p. al AA 
p=1—S (3. 33) 


估计 Er Se Sal UL HA EP PR BC. Pe 3 ia) A TF C8. 19 MEY p 估 出 。 
限制 位 点 图 谱 法 比 限制 片段 模式 法 要 乏味 一 些 ,但 却 可 靠 得 多 。 前 者 在 区 值 高 达 0 25 时 仍 可 应 
用 ， 而 后 者 对 于 K>0. 05 的 情况 就 可 能 是 不 精确 的 。 
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图 3 一 7 DNA 序列 上 限制 位 点 的 定位 图 。(a) 一 个 假想 的 DNA, 具 有 由 两 种 不 同 的 限制 酶 识别 的 识别 位 点 .该 序 
列 的 识别 图 谱 未 知 。(b)3' 端 用 放射 性 标记 . (C)DNA 由 酶 工 水 解 产生 片段 A,B 和 C, 而 由 酶 开水 解 则 产生 片段 D、 
正和 FE。(d7 用 一 种 限制 酶 得 到 的 每 一 片段 再 用 另 一 种 限制 酶 水 解 , 产 生出 亚 片 段 1 一 5。(e) 这 些 亚 片 段 被 用 于 鉴别 
重 登 片段 。(f) 这 些 亚 片段 按 它们 间 的 重 枉 模 式 指 示 的 秩序 排列 。 (g) 推 理 出 的 DNA 序列 的 限制 图 谱 。 片 段 和 亚 片 
段 可 根据 它们 的 长 度 一 个 个 地 鉴别 出 来 ,而 长 度 则 是 从 它们 在 电泳 凝 胶 上 的 位 置 推出 的 。 未 端 片段 和 亚 片 段 则 由 
其 放射 性 标记 来 鉴别 。 自 Suzuki 等 (1989) 修 改 而 成 。 


DNA—DNA 杂交 


DNA—DNA 杂交 (DNA 一 DNA hybridization ) 技 术 是 以 这 样 的 事实 为 根据 的 : 双 链 DNA 分 子 的 
热 稳定 性 有 赖 于 两 条 链 间 核 苷 酸 匹配 的 比例 。 随 着 匹配 比例 的 降低 , 双 链 的 热 稳定 性 也 降低 。 在 两 条 
链 来 自 同 一 序列 的 双 链 DNA( 即 同 源 双 链 (homoduplex) 分 子 ) 中 ,匹配 的 比例 根据 定义 应 为 100 和 % 。 
另 一 方面 ,在 两 条 链 来 源 不 同 的 双 链 DNA( 即 异 源 双 链 (heteroduplex) 分 子 ) 中 ,匹配 的 比例 则 小 于 1。 
其 大 小 有 赖 于 这 两 个 序列 自 它 们 从 某 一 共同 祖先 分 化 以 来 究竟 累积 了 多 少 核 苷 酸 关 异 。 所 以 , 异 源 双 
链 DNA 将 会 在 比 同 源 双 链 DNA 低 的 温度 下 变性 或 熔 解 成 单 链 。 

DNA 杂交 试验 的 基本 实验 程序 如 图 3 一 8 所 示 。 大 致 上 ,在 重复 序列 被 除去 以 后 ,该 程序 包括 将 
来 自 两 不 同 物种 的 变性 DNA 的 混合 物 缓慢 冷却 ,以 制造 出 人 工 杂 种 DNA 分 子 。 然 后 ,将 该 混合 物 逐 
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B 物种 同 源 双 链 
图 3 一 8 从 DNA 一 DNA 杂交 研究 推论 出 的 顺序 类 似 性 。 双 链 分 子 被 熔 解 成 单 链 的 DNA。 同 源 双 链 和 异 源 双 链 通 
过 单 链 的 重新 退火 而 形成 。50% 的 DNA 熔 解 成 单 链 的 温度 用 Tm 表示 ,测定 两 种 同 源 双 链 和 异 源 双 链 的 Tm。 两 . 
种 同 源 双 链 间 的 Tm 值 可 能 是 不 同 的 ,同样 两 互 不 相同 的 异 源 双 链 类 型 间 的 Tm 值 也 可 能 是 不 同 的 。 自 Avers 
〈《1989) 修 改 而 成 。 
渐 加 热 ,并 在 每 一 温度 下 测定 溶液 中 单 链 DNA 的 百分比 。 关 于 此 法 (TEACL 法 ) 的 详细 介绍 ,可见 例 
如 享 特等 (Hunt 等 ,1981) 的 论述 。 
杂种 DNA 的 热 稳 定性 ,用 50%% 的 杂种 DNA 解 离 成 单 链 时 的 温度 来 度量 。 然 后 将 此 半 熔 解 温度 
与 50 为 的 同 源 双 链 DNA 变 成 单 链 时 的 温度 比较 。 注 意 , 在 每 一 次 种 间 比 较 中 ,我 们 有 两 种 同 源 双 链 ， 
每 物种 各 有 一 种 ,所 以 ,习惯 上 我 们 用 它们 的 半 熔 解 温度 的 平均 值 。 同 源 双 链 和 蜡 源 双 链 的 半 熔 解 温 
度 间 差 异 ,ATm, 由 经 验证 明 , 与 碱 基 对 误 配 的 比例 近似 地 线性 相关 (Britten 等 ,1974)。 我 们 将 这 种 关 
系 表示 成 
户 一 CATm (3. 34) 
这 里 p 是 误 配 的 比例 ,C 是 一 个 常数 。C 的 值 通过 对 碱 基 对 误 配 度 已 知 的 异 源 双 链 进行 DNA 一 DNA 
杂交 试验 ,而 从 经 验 上 得 到 。C 值 被 发 现 随 实验 条 件 的 不 同 而 在 C=0. 01 和 C=0. 015 之 间 变 化 。 已 
知 ATm 的 实验 误差 是 非常 大 的 ,因此 ,对 同样 的 物种 对 应 该 做 许多 次 重复 观察 。 
现在 让 我 们 来 考虑 下 面 的 一 个 数字 例 ( 数 据 来 自 Caccone 和 Powell,1989)。 KA AK ARBRE 
(Pan paxzzscxs) 雄 性 的 同 源 双 链 DNA 的 平均 Tm 值 , 分 别 为 59.50C 和 59.12C 。 于 是 , 同 源 双 链 分 子 
的 LE 平均 值 为 59. 31C 。 两 交互 的 异 源 双 链 DNA 的 Tm 平 均值 则 为 57. 59C 。 因 此 ,ATm 为 1. 
72C. 由 等 式 3. 34, 我 们 得 到 一 个 每 核 苷 酸 位 点 大 约 0. 017 一 0. 026 次 替换 的 差异 。 
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习题 


1. 证 明 等 式 3. 3 Xt t=O 成 立 , 即 , 若 t=0 则 它 将 简化 成 等 式 3. 1 。 

2. 导出 等 式 3. 10, 并 证 明 在 朱 克 斯 - 坎 托 模型 下 Poa =Pcaw =Praw 

3. 当 a=B 时 ,木村 的 两 参数 模型 将 变 得 与 朱 克 斯 和 坎 托 的 一 参数 模型 等 同 。 为 了 证 实 这 一 点 。 
证 明 : 当 此 条 件 满 足 时 ,等 式 3. 13 将 变 得 与 等 式 3. 11 相同 , 且 等 式 3.14 和 3.15 都 变 得 与 等 式 3. 12 
相同 。 

4. 用 等 式 3. 13,3.14 和 3.15 证 明 ,在 木村 的 两 参数 模型 下 -一 个 序列 中 4 种 核 昔 酸 的 平衡 频率 
都 是 相同 的 ( 即 1/4) ,这 与 一 参数 模型 的 结果 一 样 。 

5. ASK 3.16 SS 3.17, 

6. 对 以 下 两 个 序列 


Ser Thr Glu Met Cys Leu Met Gly Gly 
TCA ee uns AMG TCT TTA . ATG | GGG GGA 
ee eon | GGG. CATA TAT) :CTAC ATG GGTin ATA 

Ser Thr Gly Ile Tyr Leu Met Gly Tle 


计算 (\a) 每 同 义 位 点 的 同 义 替 换 数 和 (b) 每 非 同 义 位 点 的 非 同 义 替 换 数 。 

7. 根据 木村 的 两 参数 模型 ,两 序列 间 的 差异 数 为 P 二 Q ,证 明 当 转换 和 颠 换 合 起 来 考虑 时 等 式 3. 
21 将 被 简化 成 等 式 3. 19。 

8. 用 点 阵 法 线性 排比 以 下 两 个 顺序 : 

AATGCTTGCATGGGGCTAGTT 

ATTGCTGCATGAGGCGCGCTAGT 
选 出 两 种 可 能 的 线性 排比 ,并 决定 用 每 核 苷 酸 为 2 BY He BE Ah Sa — Sp a AY 
裂缝 处 罚 ,比如 说 10 ,该 选择 会 受到 影响 吗 ? 


5 3 2 4 

Vv AEE ae, SS ee ee), ere | 
1 + 3 6 

人 


图 3 一 9 两 限制 性 内 切 核酸 酶 图 谱 的 假想 例 。 序 列 上 的 数字 代表 这 些 片 段 的 长 度 (以 kb 为 单位 )。 

9. 从 图 3 一 9 中 的 两 序列 的 限制 位 点 图 谱 , 估 计 两 序列 间 核 苷 酸 的 替换 数 , 用 (a) 共 有 片段 的 比 
例 , 和 (b) 共 有 限制 位 点 的 比例 。 限 制 性 内 切 核酸 酶 的 识别 顺序 为 4 RR. PA 6 RE 
点 的 限制 性 内 切 核 酸 酶 ,将 会 有 什么 样 的 结果 ? 该 差异 的 原因 是 什么 ? 
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4 核 昔 酸 蔡 换 的 速率 和 模式 


前 一 章 中 导出 的 数学 理论 可 用 于 核 苷 酸 替 换 速 率 的 研究 之 中 ,而 该 速率 则 是 分 子 进化 研究 里 的 
一 个 基本 量 。 事 实 上 ,为 了 阐明 某 一 DNA 序列 进化 的 特性 ,我 们 需要 知道 , 它 进 化 得 究竟 有 多 快 ,以 
及 其 组 成 部 分 的 核 苷 酸 替 换 速 率 是 多 少 。 比 较 一 下 基因 和 不 同 DNA 区 域 间 的 替换 速率 也 是 很 有 趣 
的 ,因为 这 可 以 帮助 我 们 理解 进化 中 核 苷 酸 蔡 换 的 机 制 。 知道 了 核 音 酸 蔡 换 的 速率 ,还 使 我 们 能 对 物 
种 间 的 分 岐 演化 这 样 的 进化 事件 ,给 出 一 个 时 间 年 代 来 .不 过 ,要 想 做 到 这 一 点 ,我 们 必须 知道 从 一 组 
物种 佑 出 的 速率 是 否 能 适用 于 另 一 组 生物 种 群 。 这 就 提出 了 这 样 一 个 问题 , 即 ,速率 在 不 同 的 进化 谱 
系 间 是 怎样 变化 的 。 


4.1 TRARY RR 


% TE WR PF 4 HY BE (rate of nucleotide substitution ) 被 定义 成 每 年 每 位 点 的 替换 数 ,并 可 用 两 同 源 
序列 间 的 替换 数 开 , 除 以 2 工 来 算出 ,这 里 工 是 两 序列 间 发 生 分 岐 的 时 间 ( 图 4 一 1)。 即 ， 


人 入 (4.1) 


祖先 序列 


序列 1 序列 2 
图 4 一 1 两 同 源 序列 在 工 年 前 从 某 一 共同 祖先 序列 分 岐 而 来 。 
两 序列 发 生 分 岐 的 时 间 工 ,假定 与 两 物种 发 生 分 化 的 时 间 相 同 , 且 通常 都 用 古生物 学 数据 资料 来 推 
算 。 

本 节 我 们 将 处 理 不 同 基因 间 , 和 某 一 基因 的 不 同 区 域 间 的 速率 变异 问题 。 为 此 目的 ,建议 对 所 有 
被 考虑 的 基因 使 用 同样 的 物种 对 。 这 有 两 重 原因 。 首先 ,关于 分 岐 时 间 的 古生物 学 估计 通常 都 有 很 天 
的 不 确定 性 。 用 同一 对 物种 ,我 们 就 可 以 无 须知 道 分 岐 时 间 而 去 比较 各 基因 间 的 进化 速率 。 其 次 , 替 
换 速 率 在 各 谱系 间 可 能 变化 很 大 ( 见 第 48 页 ) ,在 这 种 情况 下 ,两 基因 间 速 率 上 的 差异 可 能 是 由 谱系 
间 的 差异 所 造成 ,而 不 是 由 两 基因 本 身 的 差异 所 造成 的 。 

目前 研究 核 苷 酸 蔡 换 速率 的 最 合适 的 数据 来 自 哺 乳 动物 ,这 是 因为 ,有 关 哺 乳 动物 的 DNA 序列 
的 数据 最 为 丰富 ,有 关 哺 乳 类 的 化 石 记 录 相 对 而 言 特征 比较 明确 .全面 ,再 加 上 可 以 得 到 哺乳 类 之 间 
相当 可 靠 的 分 岐 时 间 的 缘故 。 


编码 区 


我 们 在 表 4 一 1 中 列 出 了 36 种 为 蛋白 质 编码 的 基因 的 同 义 蔡 换 速 率 和 非 同 义 替 换 速 率 。 这 些 速 
率 是 从 人 类 与 中 齿 类 同 源 基因 间 的 比较 中 算出 的 。 根 据 与 真 兽 亚 纲 哺乳 类 的 辐射 演化 有 关 的 古生物 
学 证 据 , 人 类 := 吵 齿 类 的 分 岐 时 间 已 被 设 定 为 8000 万 年 前 。 
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表 4 一 1 ”哺乳 类 各 为 蛋白 质 编码 的 基因 的 同 义 蔡 换 速 率 和 非 同 义 蔡 换 速率 ” 


基因 非 同 义 替 换 速 率 (X103) 同 义 替 换 速 率 (X10?) 
组 蛋白 
组 蛋白 3 135 0. 00 士 0. 00 6. 38+1.19 
组 蛋白 1 101 0. 00 士 0. 00 GE 已 - 上 3 多 
收编 系统 蛋白 
肌 动 蛋白 a 376 0.01 士 0.01 3. 68 士 0. 43 
肌 动 蛋白 349 0. 03 士 0. 02 3.1340. 39 
WR . HS Ak A ft TR HE AK 
生长 激素 释放 抑制 因子 一 28 28 0. 00 士 0. 00 3. 97 士 2. 66 
胰岛 素 51 Oss Os 4.0242. 29 
促 甲状 腺 素 118 0. 33 士 0. 08 BT 
胰岛 素 样 生 长 因子 工 179 0. 52 士 0. 09 2. 32+0. 40 
促 红细胞 生成 素 191 0.72+0.11 4. 34+0. 65 
胰岛 素 C MK 35 0. 91+0. 30 6. 7743. 49 
甲状 旁 腺 素 90 0. 94 士 0. 18 4.18 士 0. 98 
促 黄体 生成 激素 141 1. 02+0. 16 3. 29+0. 60 
生长 激素 189 1.23 0. 15 4. 95+0. 77 
尿 激酶 一 血 纤 蛋白 溶 酶 原 

435 1. 28+0. 10 3. 92+0. 44 
活化 因子 
白细胞 中 介 素 I 265 1.42+0. 14 "4. 6040. 65 
松 驰 肽 54 2.5140. 37 7.49+6. 10 
血红 和 蛋白 和 肌 红 蛋白 
o- 珠 蛋 自 141 M5550. 11 5. 14+0. 90 
肌 红 蛋白 153 0. 56+0. 10 4.44+0. 82 
B- 珠 蛋白 144 0. 80 士 0. 13 3. 05 士 0. 56 
载 脂 蛋白 
E 283 0. 98 士 0. 10 4.0440. 53 
A 三 时 243 1. 57 士 0. 16 4. 47 士 0. 66 
A 一 RN 371 1.58+0. 12 4. 15+0. 47 
免疫 球 蛋 白 
IgVu 100 1.0740. 19 5. 661. 36 
IgY, 321 1.46+0. 13 5. 1140. 64 
Igk 106 1. 8740. 26 5. 90+1. 27 
FRR 
al 166 1.4140. 13 3.5340. 61 
Bl 159 2. 2140. 24 5. 88+1. 08 
Y 136 2. 79+0. 31 8. 59+2. 56 
其 他 蛋白 质 
醛 缩 酶 A 363 0. 07 士 0. 03 3.59+0. 52 
Fe Bi ORS BR AR HK BH IE 217 0.1340. 04 2.1340. 35 
He 
肌 酸 激酶 M 380 0. 15+0. 03 3. 08+0. 37 
甘油 醛 -3- 磷 酸 脱 氢 酶 331 0. 20 士 0. 05 2. 8440. 37 
FLA A 331 0. 2040. 04 5. 03+0. 61 
乙酰 胆 碱 受 体 y 亚 基 ， 540 . 0. 29+0. 04 3. 2340. 3] 
it AF AG RY 411 ADS a 5. 82+0. 67 
AA 590 0. 9140. 07 6. 63+0. 61 
平均 * 0. 85(0. 73) 4.61(1. 44) 


a. 所 有 速率 都 以 人 和 嗜 齿 类 基因 间 的 比较 为 根据 , 且 分 岐 时 间 设 定 为 8000 万 年 以 前 。 速 率 以 每 10° 年 每 位 点 替换 数 为 单位 。 

b.L= 受 比较 的 密码 子 数 。 : 

c. 平均 指 算术 平均 值 ,括号 内 的 值 为 标准 偏差 ,都 是 用 所 有 基因 的 值 算出 的 。 

我 们 注意 到 , 非 同 义 替 换 的 速率 在 基因 间 变 化 极 大 。 变 化 幅度 从 组 蛋白 3 和 组 蛋白 4 的 有 效 数 字 

为 零 ,到 干扰 素 Y 的 每 年 每 非 同 义 位 点 2.79 又 10-?" 替 换 。 某 些 激素 (例如 生长 激素 释放 抑制 因子 一 28 
和 胰岛 素 ) 是 极其 保守 的 ,而 另 一些 激 素 则 或 者 以 中 间 速 率 ( 例 如 促 红细胞 生成 素 ) 进 化 ,或 者 以 高 速 
率 ( 例 如 白细胞 中 介 素 I 和 松 驰 肽 ) 进 化 .血红蛋白 和 肌 红 和 蛋白 以 中 速 进化 ,而 载 脂 蛋 白 和 免疫 球 重 昌 
则 进化 得 非常 迅速 。 
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同 义 蔡 换 的 速率 变化 也 相当 大 ,不 过 比 起 非 同 义 替 换 来 速率 变化 要 小 得 多 。 可 以 证 明 , 基 因 间 同 
义 蔡 换 速 率 方面 的 变异 明显 地 大 于 仅 由 统计 学 波动 造成 的 期 望 变异 。 

对 表 4 一 1 中 绝 大 多 数 基因 来 说 , 同 义 替 换 的 速率 大 大 超过 非 同 义 蔡 换 的 速率 。 如 在 一 个 最 极端 
的 例子 ,组 蛋白 3 中 ,虽然 从 其 氨基 酸 顺 序 看 它 是 进化 上 最 为 保守 的 蛋白 质 中 的 一 种 ,但 其 同 义 蔡 换 
的 速率 却 非 常 高 。 对 表 4 一 1 中 的 基因 来 说 , 非 同 义 蔡 换 的 平均 速率 为 每 年 每 非 同 义 位 点 0585 久 10 * 
替换 。 同 义 替 换 的 平均 速率 为 每 年 每 同 义 位 点 4.6X10 "替换 , 即 为 非 同 义 替 换 平均 速率 的 5 倍 。 


非 编码 区 


来 自 非 编 码 区 的 数据 远 不 如 来 自 编码 区 的 数据 丰富 ,所 以 目前 只 做 过 有 限 的 比较 分 析 工作 。( 注 
意 ,要 估 出 某 一 序列 中 的 替换 速率 ,我 们 必须 至 少 有 来 自 两 个 物种 的 数据 。) 因 为 大 多 数 已 发 表 的 序列 
为 mRNA ,它们 不 含 内 含 子 和 侧 区 域 , 所 以 ,其 5 和 3' 不 翻译 区 是 唯一 能 进行 仔细 研究 的 非 编码 区 . 
表 4 一 2 列 出 了 根据 人 与 咕 齿 类 比较 得 到 的 16 种 基因 中 这 两 个 区 域 的 替换 速率 。 在 这 两 个 区 域 中 不 
同 基因 间 的 速率 变化 都 非常 大 ,但 这 种 变异 可 能 很 大 程度 上 代表 了 抽样 所 造成 的 影响 ,因为 这 两 区 域 
通常 都 非常 短 。 在 几乎 所 有 基因 中 ,5' 和 .3' 不 翻译 区 中 的 速率 都 低 于 四 重 简 并 位 点 上 的 替换 速率 ( 即 ， 
其 上 所 有 可 能 的 核 苷 酸 蔡 换 都 是 同 义 蔡 换 的 位 点 )。5 和 3' 不 翻译 区 的 平均 速率 分 别 为 每 年 1. 96 X 
10 "和 2.10X10 替换， 它们 都 约 为 四 重 简 并 位 点 上 的 平均 速率 ,每 年 3. 55X10 替换 的 60% 。 

表 4 一 2 根据 人 与 小 鼠 或 大 鼠 的 基因 间 比 较 ,得 到 的 为 蛋白 质 编码 的 基因 的 Rs 不 翻译 区 和 四 重 简 并 位 点 
上 的 核 背 酸 蔡 换 速 率 * 


5' 不 翻译 区 3' 不 翻译 区 四 重 简 并 位 点 
> ye ce 速率 二 速率 L 速率 

ACTH 9099 7 二 0ORT 07 «| 25 上 01 275 Beyer 
醛 缩 酶 A 124 1. 08:0.26 154 1:7340.32 195 3.160.408 
载 脂 蛋白 A— 83 3.0640. .63053473 二 全 35 160 3. 38 士 0. 50 
aK AE 23 1. 27+0. 69 84 1.70+0.42 . 153 ‘4.0040. 60 
Na, K-ATP fig 8 118 2.45+0.45 1117 0.5740.06 118 2.87+0.54 
肌 酸 激酶 M 70 1.714:0.46 968 1.79-0.30 178 2. 812:028m 
o- 胎 蛋 自 47 3.6441.13 144 2.79+0.49 225 4.144+0.54 
o- 珠 蛋白 34 1.5640.65 90° 2.2140.50 81 4.47+0.98 © 
B- 珠 蛋白 50 1.3040.46 126 2.85+0.49 78 2. 42+0. 56 
甘油 醛 -3- 磷 酸 脱 氢 酶 70 -153440.38 121 1.74 土 0.36 .170 2. 430. 39 
生长 激素 21. -1.79+0.85 91. 1.8340.41 83  3.8240.78 
胰岛 素 56 2.92+0.80 ‘53° 3.09+0.81 62 4.19+1.00 
白细胞 中 介 素 :1 59 1.09 寺 0.38 1046 2.02+0.14 105 2.97+0.60 
乳酸 脱氧 酶 A 95 2.7940.85 , 470 2.4840.23 152 346440560 
pi aac aes 61 1.88+0.52 111 2.5740.48 23 2.37+1.00 
酸 三 甲 基 内 盐 1 

甲状 旁 腺 素 84. «1.794043 228 2.2140.30 38 3.85+1.21 
平均 * 1. 96(0. 78) 2. 10(0. 61) 3. 33(0. 69) 

a. 速率 以 每 10? 年 每 位 点 替换 数 为 单位 。 b. L= fi BM. 


c\ 平 均 指 算术 平均 ,括号 内 的 值 为 标准 偏差 ,都 是 用 所 有 基因 的 值 算出 的 。 

假 基 因 (pseudogenes) 是 一 些 由 功能 基因 派生 ,但 由 于 发 生 了 阻止 其 正常 表达 的 突变 而 退化 成 无 
功能 的 DNA 序列 (第 六 章 和 第 七 章 )。 由 于 它们 不 受 功 能 限制 ,所 以 ,它们 可 以 期 望 以 较 高 的 速率 进 
化 。 表 4 一 3 列 出 了 乳牛 和 山羊 的 4y 队 和 凡 ' 假 基因 中 苦 换 速率 间 的 比较 ,以 及 B 一 和 7 一 珠 蛋 自 基因 
中 非 编 码 区 和 四 重 简 并 位 点 上 的 速率 间 的 比较 。 这 些 假 基因 中 的 速率 事实 上 略 高 于 其 他 区 域 中 的 速 
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率 。 看 来 这 一 点 对 假 基 因 来 说 是 普遍 成 立 的 ,尽管 目前 有 关 假 基因 的 资料 尚 属 有 限 。 
表 4 一 3 乳牛 和 山羊 的 B 一 和 7 一 珠 蛋 和 白 基 因 间 的 分 岐 ,以 及 B 一 珠 蛋 和 白 假 基因 间 的 分 上 
EEN BR 和 小 珠 蛋白 基因 。 
统计 量 SFL BUT mmm? WAP SUT gL BH 
HAHA 5.3 Tad . 1 BiG 8.1 8.8 6 | Shah 
标准 误差 u2 2.0 2.5 O07 2.2 1.5 0.9 
an FL = {0 Jak ; UT = 76 aa OK ah 5 DA Pe IE — WO A PE A 
4 一 2 中 .我 们 对 基因 的 不 同 区 域 中 .以 及 假 基 因 中 的 替换 速率 进行 了 比较 .关于 5' 和 3' 不 翻译 
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图 4 一 2 大 

区 域 , 非 简 并 位 点 ,两 重 简 并 位 点 和 四 重 简 并 位 点 的 速率 ,都 是 将 表 4- 2 中 所 列 基因 加 以 平均 后 的 平 
均 速 率 。5' 侧 区 域 的 速率 ,通过 假定 该 速率 与 四 重 简 并 位 点 上 的 速率 之 比 为 5. 3/8. 6( 即 由 表 4 一 3 得 
出 的 值 ), 和 四 重 简 并 位 点 上 的 平均 速率 为 每 年 3. 33X10-? 替 换 ( 表 4 一 2) 而 算出 。 内 含 子 的 速率 ,3/ 
侧 区 域 的 速率 以 及 假 基 因 的 速率 也 按 同 样 方式 算出 。 由 于 以 有 限 的 资料 为 基础 而 作出 的 估计 已 经 够 
多 了 ,又 由 于 一 个 区 域 中 的 速率 会 因 基 因 的 不 同 而 有 差异 ,所 以 ,图 4 一 2 中 展示 的 速率 可 能 对 任何 一 
个 具体 的 基因 都 是 不 适用 的 ,但 它 却 提供 了 不 同 DNA 区 域 中 的 替换 速率 间 一 个 大 致 的 .一 般 性 的 比 
较 . 有 了 这 种 思想 准备 ,我 们 将 看 到 ,一 个 基因 中 的 替换 速率 以 四 重 简 并 位 点 上 的 为 最 高 ,内 含 子 中 和 
3' 侧 区 域 中 要 略 低 一 些 ,3' 不 翻译 区 域 ,5' 侧 区 域 ,5' 不 翻译 区 域 和 两 重 简 并 位 点 有 中 等 大 小 ,而 非 简 
并 位 点 上 的 为 最 低 。 平 均 下 来 假 基因 有 最 高 的 替换 速率 ,虽然 它 只 比 一 个 功能 基因 的 四 重 简 并 位 点 上 
的 速率 稍 高 一 些 。 


4.2 和 蔡 换 速率 变异 的 原因 


为 了 推理 出 DNA 区 域 间 替 换 速率 出 现 变 异 的 原因 ,我们 应 注意 到 ,替换 速率 是 由 两 个 因子 所 决 
” 定 的 :(1) 突 变 率 和 (2) 一 个 突变 的 固定 概率 (第 二 章 )。 后 者 又 与 该 突变 是 有 利 的 .中 性 的 还 是 有 害 的 
有 关 。 由 于 突变 率 看 来 在 一 个 基因 内 变化 不 大 而 在 不 同 基因 间 则 可 能 变化 较 大 ,所 以 ,我 们 将 对 一 个 
“基因 的 不 同 区 域 间 的 速率 变异 和 不 同 基因 间 的 速率 变异 分 别 讨论 。 


不 同 基因 区 域 间 的 变异 


我 们 首先 考虑 一 个 基因 中 同 义 位 点 和 非 同 义 位 点 间 的 大 差异 。 由 于 一 个 基因 内 同 义 位 点 与 非 同 
义 位 点 上 的 突变 率 应 该 相同 ,或 者 至 少 是 非常 相似 ,所 以 ,替换 速率 上 的 差异 就 可 归 因 于 两 种 不 同类 
。 495。 


型 位 点 间 纯 洁 化 选择 的 强度 上 的 差异 。 这 可 用 分 子 进 化 的 中 性 学 说 来 理解 (第 二 章 )。 结 果 会 导 - 氮 

基 酸 替换 的 突变 比 同 义 的 改变 对 该 蛋白 质 的 功能 造成 有 害 影响 的 机 会 要 高 。 所 以 , 绝 大 多 数 非 同 义 突 

变 都 将 受 纯洁 化 选择 而 从 群体 中 清除 。 其 结果 将 使 非 同 义 位 点 上 的 替换 速率 降低 。 相 比 之 下 , 同 义 的 
改变 有 较 高 的 机 会 是 中 性 的 ,而 它们 中 在 群体 中 固定 的 也 要 多 些 。 

当然 , 非 同 义 替 换 可 能 有 幸 使 蛋白 质 的 功能 得 到 改善 。 然 而 ,如 果 有 利 选 择 在 该 蛋白 质 的 进化 中 
起 主要 作用 的 话 , 则 非 同 义 蔡 换 的 速率 应 该 超过 同 义 替 换 的 速率 .事实 上 ,在 某 些 免疫 球 蛋 白 基 因 里 ， 
决定 互补 性 的 区 域 (CDRs,， 又 以 高 可 变 区 著称 ) 中 非 同 义 的 速率 高 于 同 义 的 速率 。 这 种 较 高 的 速率 已 
经 归 因 于 对 抗体 多 样 性 的 超 显 性 选择 (CTanaka 和 Nei,1989)。 不 过 , 当 考 虑 的 是 整个 免疫 球 蛋 自 基 因 
时 , 非 同 义 的 速率 仍然 大 大 低 于 同 义 的 速率 ( 表 4 一 1) 。 这 个 结果 指出 ,即使 在 免疫 球 蛋白 中 ,大 多 数 
非 同 义 突变 也 是 不 利 的 ,并 且 将 从 群体 中 清除 。 休 斯 和 根 井 (Hughes 和 Nei,1989) 曾 报导 在 主 组 织 相 
容 性 复合 体 基 因 的 某 些 区 域 中 有 类 似 情形 , 即 非 同 义 替 换 的 速率 超过 同 义 替 换 的 速率 。 他 们 把 非 同 义 
替换 有 更 高 的 速率 归 因 于 超 显 性 选择 。 

一 个 基因 中 同 义 的 和 非 同 义 的 速率 间 的 对 比 证 明了 分 子 进化 中 一 个 众所周知 的 原则 , 即 ,对 某 一 
大 分 子 的 功能 限制 越 强 , 则 其 进化 的 速率 就 越 缓 慢 。 杰 村 Kimura,19837 曾 用 一 个 简单 模型 将 此 原则 
表达 成 一 个 公式 。 假 定 某 一 分 子 中 所 有 突变 的 某 一 部 分 上 ,是 选择 中 性 或 近 下 竹 的 ;而 其 余 的 则 是 有 
Sica ae ee a ne ea ed 它们 对 整个 分 子 进 化 
的 速率 没有 多 大 贡献 )。 如 果 我 们 用 vr 表示 每 单位 时 间 每 位 点 的 总 突变 率 , 那 么 ,中 性 突变 的 突变 率 
即 为 zw 王 zrf。 根 据 分 子 进化 的 中 性 学 说 ,替换 速率 为 民 王 wm (第 二 章 )。 因 此 ， 

/大 C4.2) 
在 任 一 给 定 基因 内 ,该 zr 值 可 假定 对 同 义 位 点 和 非 同 义 位 点 都 是 相同 的 。 然 而 ,fs 值 则 是 同 义 位 点 的 
比 非 同 义 位 点 的 高 ,所 以 前 者 要 比 后 者 进化 得 快 。 虽 然 该 模型 是 过 于 简单 了 ,但 它 对 解释 不 同 DNA 
区 域 间 速率 上 的 差异 却 很 有 帮助 。 

依 上 述 模型 看 ,最 高 的 速率 预期 应 出 现在 一 个 没有 任何 功能 的 序列 中 ,由 于 没有 功能 ,所 以 它 里 
面 的 所 有 突变 都 是 中 性 的 ( 即 ff=1)。 事 实 上 , 假 基 因 看 起 来 的 确 有 最 高 的 核 苷 酸 蔡 换 速率 ( 表 4 一 3 
和 图 4 一 2)。5 和 3!' 不 翻译 区 有 比 编码 区 中 的 同 义 替 换 更 低 的 替换 速率 ,这 一 观察 事实 进一步 支持 解 
释 问 题 的 中 性 路 线 , 因 为 这 些 区 域 含 有 关于 转录 起 始 和 终止 的 信和 号 

在 一 个 蛋白 质 内 ,有 不 同 结构 和 功能 的 区 域 看 来 受 着 有 差别 的 功能 限制 ,并 以 不 同 速率 进化 着 。 
胰岛 素 原 为 此 提供 了 一 个 极 好 的 例子 。 它 由 A,B 和 C 三 个 片段 组 成 (图 4 一 3) ,片段 C 位 于 分 子 的 中 
间 ,并 在 活性 激素 (胰岛 纪 上 ) 形 成 期 间 被 除去 即 胰岛 素 是 由 余下 的 A 和 B 两 个 片段 所 构成 的 。 片 段 C 

人 
B 链 C ik A 4 


(一 
胰岛 素 被 切除 的 肽 
进化 速率 0.13x 102/ 位 点 /年 ”进化 速率 0.97 x 10/ 位 点 /年 
图 4 一 3 AAA AEA IR Sy ACN Fo Ls 44) 0 C 肽 编码 的 UNA 区 域 中 核 将 酸 赫 换 速 率 间 的 比较 。 成 熟 的 胰岛 素 分 子 
由 一 条 人 A 链 和 一 条 也 链 ,通过 二 硫 键 (S) 联 结 而 成 。 自 Kimura(1983) 修 改 而 成 。 ， 
对 胰 马 素 的 激素 活性 不 起 任何 作 用 ,而 被 认为 只 对 产生 该 激素 的 正确 三 级 结构 有 促进 效果 。 结 果 ,为 


C 户 段 编 码 的 区 域 的 非 同 义 替 换 速 率 , 为 A 链 和 也 链 编码 的 区 域 的 平均 非 同 义 替 换 速 率 的 7 倍 多 
(图 4 一 3)。 然 而 ,C 片段 上 一 定 仍 受 着 相当 程度 的 限制 ,因为 该 区 域 中 的 非 同 义 替 换 速 率 还 是 比较 低 
的 , 它 与 一 珠 蛋 日 中 的 相应 速率 大 致 相当 ( 表 4 一 1)。 


s。 0，。 


基因 间 的 变异 


为 了 对 基因 间 非 同 义 替 换 速率 方面 的 大 变异 作出 解释 ,我 们 必须 再 次 考虑 这 样 两 个 可 能 的 牧 事 
者 :突变 率 和 选择 强度 .不 同 的 基因 有 相同 的 突变 率 , 这 样 的 假定 在 这 种 情况 下 可 能 不 能 成 立 , 因 为 基 
因 组 的 不 同 区 域 可 能 有 着 不 同 的 突变 倾向 。 沃 尔 夫 等 (Wolfe 等 ,1989a) 曾 提出 ,哺乳 动物 细胞 核 基 因 
组 的 不 同 区 域 , 在 突变 率 方 面 的 差异 相互 间 以 一 个 数值 为 2 的 因子 来 区 别 。 然 而 ,不 同 基因 组 区 域 间 
突变 率 上 出 现 2 倍 的 差异 ,甚至 不 能 算 作 造 成 非 同 义 替 换 速 率 方面 将 近 1000 倍 的 出 人 的 部 分 原因 。 
所 以 ,决定 非 同 义 替 换 速 率 的 最 重要 因素 看 来 还 是 选择 强度 , 它 又 转 而 由 功能 限制 所 决定 。 

为 了 说 明 功 能 限制 的 效应 ,让 我 们 考虑 一 下 载 脂 蛋 白 和 组 蛋白 3, 它 们 有 着 差异 显著 的 非 同 义 蔡 
换 速 率 。 载 脂 蛋 白 是 兰 椎 动物 血液 中 各 种 脂 类 的 主要 载体 ,而 它们 的 脂 类 结合 区 大 部 分 由 下 水 性 残 基 
所 组 成 。 对 来 自 哺 乳 纲 各 目的 载 脂 蛋白 的 顺序 比较 分 析 表 明 ,该 区 域内 由 一 个 下 水 性 氨基 酸 ( 比 如 纺 
氨 酸 、 亮 氨 酸 ) 去 替换 另 一 个 踊 水 性 氨基 酸 , 这 在 许多 位 点 上 都 是 可 以 接受 的 (Luo 等 ,1989)。 这 种 不 
太 严 格 的 结构 要 求 可 用 来 解释 为 什么 这 些 基因 中 的 非 同 义 的 速率 会 相当 高 ( 表 4 一 1)。 

处 于 另 一 个 极端 的 是 组 蛋白 3。 因 为 组 蛋白 3 中 的 大 多 数 氨 基 酸 在 核 小 体 ( 图 4 一 4) 形 成 时 ,将 直 
接 与 DNA 或 其 他 核心 组 蛋白 相 所 作用 .所 以 .可 以 合理 地 假定 .只 有 很 少 几 种 可 能 的 替换 能 在 不 妨 

联结 者 DNA 组 蛋白 2A,2B,3,4 


组 蛋白 1 


图 4 一 4 一 个 核 小 体 的 示意 图 。DNA 双 螺 旋 ( 黑 色 带 ) 转 着 核心 组 蛋白 iA 2A.2K.3 Fe 4 SH) BK, BE 
白 1( 淡 灰色 ) 与 该 核心 粒子 的 外 部 和 联结 者 DNA( 白 色 带 ) 相 结合 。 自 Stryer (1988) 修 改 而 成 
碍 该 蛋白 质 功 能 的 条 件 下 发 生 。 此 外 ,组 蛋白 3 还 必须 维持 其 严格 的 致密 性 和 高 度 碱 性 ,这 对 与 酸性 
的 DNA 分 子 相互 作 用 是 必要 的 。 结 果 , 组 蛋白 3 对 大 多 数 分 子 变 化 都 绝 不 容忍 。 事 实 上 ,这 种 和 蛋白质 
是 已 知 的 进化 最 为 缓慢 的 和 蛋白质 之 一 , 比 载 脂 和 蛋白 要 慢 1000 多 倍 。 

同 义 替 换 的 速率 为 什么 也 会 因 基 因而 异 还 不 太 清楚 。 出 现 这 种 变异 可 能 有 两 个 原因 。 首先 ,基因 
组 的 不 同 区 域 间 突 变 率 可 能 是 不 同 的 ,因而 同 义 替 换 速 率 上 的 变异 可 能 简单 地 反映 出 基因 所 处 的 染 
色 体 位 置 (Wolfe 等 ,1989a)。 这 种 可 能 性 因 这 样 的 事实 而 得 到 进一步 的 支持 , 即 , 真 核 生 物 的 基因 组 
是 由 被 称 为 同 质 段 的 明显 地 以 GC 为 内 容 的 片段 所 构成 的 ,这 些 片段 可 能 是 独立 复制 的 因而 可 能 表 
现 出 不 同 的 突变 率 ( 第 八 章 )。 第 二 个 原因 可 能 是 ,在 某 些 基因 中 ,并 不 是 所 有 密码 子 都 是 在 适合 度 上 
等 价 的 。 结 果 , 有 些 同 义 替 换 可 能 会 受到 选择 的 排斥 。 这 种 纯洁 化 选择 就 会 在 基因 间 产 生 同 义 替 换 速 
率 方 面 的 变异 。 然 而 ,虽然 纯洁 化 选择 已 被 证 明 能 影响 同 义 替 换 的 速率 ,能 影响 细菌 .酵母 和 果 蝇 的 基 
因 组 中 同 义 密 码 子 的 使 用 模式 ,但 现在 还 不 清楚 这 类 选择 是 否 在 哺乳 类 中 发 生 作 用 ( 见 第 55 页 ) 。 

还 有 一 种 现象 也 曾 受到 注意 , 即 一 个 基因 中 的 同 义 蔡 换 速 率 和 非 同 义 替 换 速 率 间 存在 一 种 正 相 
关 (Graur,1985; Li 等 ,1985b)。 若 假定 突变 率 随 基因 而 变 (因此 有 些 基因 的 同 义 和 非 同 义 的 替换 速率 
将 都 很 总 ) ,或 者 假定 同 义 位 置 上 的 选择 大 小 受 邻 近 的 非 同 义 位 置 上 核 苷 酸 组 成 的 影响 , 则 该 现象 即 
可 得 到 解释 CTicher 和 Graur, 1989). 


4.3 一 个 正 选 择 例子 :乳牛 和 叶 猴 的 浴 菌 酶 


如 前 面 的 章节 所 讨论 的 那样 ,基因 组 的 绝 大 多 数 基因 和 非 基因 区 域 中 核 苷 酸 替 换 的 速率 和 模式 ， 
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都 可 以 通过 四 突变 输入 ,@ 中 性 或 近 中 性 等 位 基因 的 随机 遗传 漂 变 ,和 人 排斥 有 害 等 位 基因 的 纯洁 化 
选择 ,这 三 方面 的 结合 来 加 以 解释 .然而 ,在 浴 菌 酶 的 例子 中 ,对 有 利 突 变 的 正 选择 曾 被 证 明 在 某 些 哺 
乳 类 谱系 中 起 作用 。 

前 肠 发 酵 消 化 曾 在 有 胎盘 哺乳 类 的 进化 中 独立 地 两 次 出 现 , 一 次 在 反刍 动物 (例如 乳牛 ) 中 , 另 一 
次 在 疣 猴 类 (例如 叶 猴 ) 中 。 在 这 两 种 情况 中 ,对 别 的 哺乳 动物 来 说 通常 不 在 胃 中 分 弯 产 生 的 溶菌 酶 ， 
它 能 补充 进来 ,以 消化 在 前 肠 执行 发 酵 任 务 的 细菌 的 细胞 壁 。 斯 图 尔 特 和 威尔逊 (Stewart 和 Wilson, 
1987) 曾 对 来 自 乳 牛 . 叶 猴 、 独 卯 .人 \ 大 鼠 . 马 和 鸡 的 溶菌 酶 进行 过 氨基 酸 顺 序 比 较 ( 表 4 一 4) 。 他 们 注 
意 到 ,乳牛 和 叶 猴 间 有 4 个 独特 地 共有 的 氨基 酸 。 对 这 一 观察 结果 有 两 种 可 能 的 解释 。 第 一 种 :有 可 
能 乳牛 在 进化 上 与 叶 猴 的 亲缘 关系 比 与 马 的 更 近 , 于 是 这 些 独特 地 共有 的 氨基 酸 , 只 代表 出 现在 它们 
的 共同 祖先 中 未 发 生 改 变 的 氨基 酸 顺 序 。 乳 牛 和 叶 猴 间 系 统 发 生 关系 更 近 的 假定 已 知 是 错误 的 。 另 
一 种 ,这 些 在 该 两 物种 中 独特 地 共有 的 氨基 酸 ,可 能 是 独立 地 发 生 在 两 个 谱系 中 的 一 系列 平行 蔡 换 的 
结果 。 事 实 上 ,将 氨基 酸 蔡 换 的 顺序 重建 后 ,斯图尔特 和 威尔逊 CStewart and Wilson,1987) 发 现在 乳 
牛 和 叶 猴 谱系 中 有 7 个 平行 或 趋同 替换 (图 4 一 5)。 

表 4 一 4 不 同 物种 的 溶菌 酶 间 顺 序 的 成 对 比较 ” 
物 种 


物种 
MH AR Bb Bi 人 大 鼠 乳牛 5% 

叶 猴 14 inte +38 32 65 
Hh Hb 0 14 33 39 65 

人 0 1 

K fa 0 1 i 
A+ 4 0 

马 0 0 


自 Stewart 和 Wilson(1987) 。 
a. 对 角 线 上 的 数 为 物种 间 氨 基 酸 的 差异 数 , 而 对 角 线 下 的 数 为 物种 间 独 特地 共有 的 残 基数 。 
而 且 , 已 经 确定 ,这 些 替换 中 有 些 对 溶菌 酶 在 低 pH 值 下 更 好 地 行使 功能 有 贡献 , 象 在 反刍 动物 


人 
K14 K21 V23 E41 E50 N67 D75 N87 K119 K126 


32| 叶 猴 


See | 
L17_ $101 


12 


D37  H62 N82 T90 


i Bh 
M29 R41 A47 R50 L79 R115 R122 


图 4 一 5 乳牛 和 叶 钦 溶菌 酶 中 的 平行 或 趋同 氨基 酸 替 代 。 谱 系 的 长 度 与 沿 该 谱系 发 生 的 氨基 酸 替 代数 成 正比 。 每 
次 替代 用 替代 后 氨基 酸 的 一 字母 缩写 ( 表 1 一 1) 表 示 , 其 后 续 数字 表示 替代 发 生 的 位 置 。 箭 头 指出 了 叶 猴 中 发 生 的 
7 次 替代 ,它们 以 与 乳牛 谱系 平行 或 趋同 的 形式 发 生 。 与 乳牛 胃 溶 菌 酶 (没有 画 出 ) 的 氨基 酸 差 异 数 写 在 方块 之 中 。 
自 Stewart 和 Wilson, (1987). 
消化 系统 中 发 现 的 那些 酶 。 相 反 , 叶 猴 和 乳牛 溶菌 酶 在 高 pH AF AO AO. BR 
可 以 不 出 什么 差错 地 推论 ,我 们 这 里 处 理 的 是 一 个 有 利 蔡 换 在 不 同 进 化 路 线 中 平行 地 发 生 , 表 现 出 对 
类 似 的 选择 因子 平行 地 适应 的 例子 。 


4.4 分子 钟 


在 对 来 自 不 同 物种 的 血红 蛋白 和 细胞 色素 e 的 蛋白 质 顺序 比较 研究 中 , 朱 克 坎 德尔 和 波 林 
。48 。 


《Zuckerkandl 和 Pauling,1962,1965) 以 及 马 苞 利 阿 什 4Margoliash ,1963) 首 次 注意 到 ,这 些 蛋 白质 中 


的 氨基 酸 替 换 速 率 在 不 同 的 哺乳 类 谱系 中 近似 相同 。 因 此 朱 克 坎 德尔 和 波 林 (Zuckerkandl 和 Paul- 
ao 
之 ,就 是 存在 着 一 种 分 子 钟 (molecular clock)。 这 一 提议 马上 激 起 了 人 们 对 将 大 分 子 用 于 进化 研究 的 
极 大 兴趣 。 事 实 上 ,如果 蛋 白质 是 以 恒定 的 速率 进化 着 的 ,那么 ,它们 将 可 用 于 决定 物种 分 岐 的 年 代 ， 
并 用 来 重建 生物 间 的 系统 发 育 关 系 。 这 将 与 通过 测定 放射 性 元 素 的 衰变 来 决定 地 质 年 代 类 似 。 

分 子 钟 假说 也 激 起 了 大 量 的 争论 。 例 如 ,经 典 进化 论 学 者 们 就 反对 这 种 说 法 ,因为 进化 速率 恒定 
的 说 法 与 在 表 型 和 生理 学 水 平 上 进化 速率 的 变化 无 常 对 不 上 号 。 当 速率 恒定 假说 用 于 估计 人 与 非洲 
猿 间 的 分 岐 时 间 ,得 到 一 个 500 万 年 的 估 值 CSarich 和 Wilson ,1967) 时 ,该 假说 受到 了 特别 强烈 的 反 
对 。 因 为 ,在 古生物 学 家 中 占 统治 地 位 的 观点 是 ,人 和 猿 的 分 岐 至 少 应 在 1500 万 年 前 ,两 者 差 得 太 远 。 
许多 分 子 进化 科学 家 们 也 对 分 子 钟 假说 的 正确 性 提出 了 异议。 特别 是 古 德 曼 (Goodman ,1981) 以 及 
他 的 同事 们 (Czelusniak 等 ,1982)。 他 们 认为 ,进化 速率 常常 在 基因 重复 之 后 出 现 加 速 , 而 蛋白 质 顺 序 
在 适应 性 辐射 的 年 代 里 进化 要 快 得 多 。 例 如 ,他 们 主张 ,在 基因 重复 使 vc 和 有 8 血红 蛋白 分 开 之 后 出 现 
了 极 高 的 氨基 酸 蔡 换 速 率 , 而 这 种 高 替换 速率 则 是 由 于 改善 血红 蛋白 功能 的 有 利 突变 所 造成 的 。 

虽然 速率 恒定 假说 一 直 是 有 争议 的 ,但 它 已 广泛 用 于 分 岐 时 间 的 估计 和 系统 发 育 树 的 重建 中 
(Nei,1975; Wilson 等 ,1977) 。 所 以 ,分 子 钟 假说 的 正确 性 在 分 子 进 化 中 是 一 个 生死 依 关 的 问题 。 近 几 
年 中 DNA 顺序 数据 的 迅速 积累 为 检验 该 假说 提供 了 一 个 全 新 的 机 会 。 用 这 类 数据 与 用 蛋白 质 顺 序 
数据 相 比 可 使 我 们 更 近 地 检 验 该 假说 ,而 与 DNA 一 DNA 杂交 数据 和 免疫 距离 数据 相 比 , 则 可 得 到 更 
直接 的 解释 。 


相对 速率 测验 


关于 分 子 钟 假说 的 争论 常常 引起 有 关 物 种 分 岐 年 代 的 异议 .为 了 避免 这 一 问题 , 萨 里 奇 和 威尔逊 
(Sarich 和 Wilson ,1973) 提 出 了 一 种 不 需要 知道 分 岐 年 代 的 检验 法 。 该 检验 法 称 相 对 速率 测验 (rela- 
tive-rate test), 如 图 4 一 6 所 示 。 假定 我 们 要 比较 谱系 A 和 B 中 的 速率 。 于 是 ,我 们 用 第 3 个 物种 C 作 
为 参照 物 。 我们 应 该 确定 ,该 参照 物种 的 分 岐 过 程 发 生得 比 物 种 A 和 也 间 的 分 岐 更 早 。 例 如 ,为 了 比 
较 人 和 马 来 猩 猩 谱 系 中 的 速率 ,我 们 用 一 种 猴 作 为 参照 物 。 


A B C 
图 4 一 6 用 于 相对 速率 测验 的 系统 树 。O 表示 物种 A 和 也 的 共同 祖先 。 
从 图 4 一 6 很 容易 看 出 ,物种 A 和 C 间 的 替换 数 KAc 等 于 从 点 O 到 点 A RA AY RR (Kon) FIM 
点 O 到 点 CC 发生 的 替换 数 (Koc) 之 和 。 即 ， 


Kac = Koa + Koc (4, 3a) 
类 似 地 ,有 : 

Kec 一 天 os + Koc (4. 36) 
和 

Kas = Koa + Kos (4. 3c) 


FAN KacsKac fl Kan fe MF OR IE EB Fie Ha CG = BE), A. BR ATT DAR Sh tS 个 方程 , 找 
到 | Koa > Kop Fi Koc Wk : 
+496 


Kac += Kaz “sx Kec 


Koa a 2 (4, 4a) 
Ss See 

Kos = pears 34 学 ae (4. 46) 

Koc = Kac + Koc — Kas (A. 4c) 


2 
现在 我 们 可 以 通过 Koa Al Kos 的 值 ,来 决定 替换 速率 在 谱系 A MIBABPEAHMS. AWHA AB 
最 后 地 共有 一 个 共同 祖先 以 来 所 经 过 的 时 间 ,定义 为 对 两 个 谱系 是 相等 的 。 所 以 , 按 分 子 钟 假说 ,KoA 
和 Kos 应 该 相等 BY ,Ko 一 Kos 王 0。 从 等 式 4.3a 和 4.3b FT WA AH » Koa —Kos=Kac—Kes. 故而 ,我 们 
可 以 从 天 Ac 和 Kesc 来 直接 比较 A 和 B 中 的 替换 速率 。 


小 鼠 和 大 鼠 中 接近 相等 的 速率 


表 4 一 5 展示 了 用 相对 速率 测验 法 进行 的 小 鼠 和 大 鼠 中 同 义 替 换 速 率 的 比较 。 表 中 的 物种 A 此 
HE) BL. i FP BWM ARK. A.A 天 Ac 一 Kesc 的 值 为 一 正 号 , 则 表示 小 鼠 中 的 速率 高 于 大 鼠 中 
的 ,而 若 为 负 号 则 指示 实际 情况 正好 相反 。 

表 4 一 5 小 鼠 (物种 A) 和 大 鼠 ( 物 种 B) 间 每 100 位 点 的 同 义 替 换 数 差异 (KAc-Kac) 


基因 LY 下 AAAENKEE Kac— Kec 
载 脂 蛋白 E 201 7.4 6108 59.5 1.845.3 
肌 动 蛋白 a 249 17.9 58.2 59.1 —0.9+4.8 — 
肌 动 蛋白 233) 19.70 SO 4654 5.0+4. 6 
Thy-1 抗原 116. 19.3 5L8 5703 —5.5+68 
乳酸 脱 氢 酶 A 219 30.9 80.4 80.3 0.148. 2 
糖 蛋 白 激素 ,ax WE 58) “730.8 297.7 Gaus 13.4+18.5 
胰 马 素 样 生长 因子 1 130 4.8 37.0 40.9 =3° 92-28 
心房 钠 尿 因子 107 20.4 69.7 57.4 12. 348.3 
生长 激素 2 i a ee iy 
FAR AR ER AL B G0 "ba? eee ee 7 ceo Lig fc oh 
FS Fy FRR SS BH Dik 154 Dh GIRS Bee y 8.8+6.5 
醛 缩 酶 A 184. 15 a 57.5 63.3 Sa ec eS 
肌 酸 激酶 M 251 /1722) 28.6. Bee 3.64.3 
ie J Bit FE AA A FAL 35 19 Oy Aeon aee7 8.8410. 2 
rath 1 
Sit 2187 19.0 59.8 59.4 0.421. 5 

A Li 等 (1987a) 


a 工 一 受 比较 位 点 数 。Ki 一 物种 1 和 j 间 每 100 位 点 的 替换 数 。 人 为 参照 物种 (c), 但 肌 酸 激酶 M 为 一 例外 ,该 行 数据 是 用 免 的 顺 
序 作 为 参照 物 得 出 的 。 


由 于 受 资 料 限 制 , 我 们 用 作 参 照 物 的 是 人 或 兔 的 顺序 ,而 不 是 从 与 小 鼠 和 大 鼠 的 亲缘 关系 更 近 的 物 
种 , 象 仓 鼠 或 豚鼠 中 得 到 的 顺序 。 结 果 ,Kcs 一 Kec 的 估 值 表现 出 较 大 的 统计 误差 ( 表 4 一 5)。 不 过 ,小 鼠 
和 大 鼠 中 的 蔡 换 速率 接近 相等 ,这 一 点 是 相当 明显 的 。 换 句 话说 , 当 将 所 有 顺序 一 起 考虑 时 ,该 速率 差 
接近 于 0。 关 于 这 两 个 物种 中 非 同 义 蔡 换 的 速率 ,可 得 出 同样 的 结论 (Li 等 ,1987a) 。 


人 中 的 速率 低 于 猴 的 速率 


根据 免疫 距离 和 蛋白质 顺序 数据 , 古 德 曼 (Goodman,1961) 及 其 同事 们 (Goodman 等 ,1971 ) 提 

出 ,大 科 动 物 ( 人 和 和 猿 ) 自 它们 从 远古 时 代 与 猴 分 离 后 ,出 现 了 速率 减缓 。 然 而 ,威尔逊 等 (Wilsom 等 ， 

1977) SQ BR DE ,减缓 是 一 种 人 为 现象 ,是 用 了 对 人 一 狼 分 岐 时 间 的 错误 估 值 的 结果 。 他 们 用 免疫 上 距离 数 
s。 DO0O。 


据 和 蛋白质 顺 序数 据 做 了 两 次 相对 速率 测验 ,结论 是 ,没有 任何 表明 人 科 动 物 速率 减缓 的 证 据 。 

DNA 顺序 数据 可 对 上 述 争 论 给 出 一 个 更 好 的 解决 。 在 表 4 一 6 中 ,相对 速率 测验 法 被 用 于 比较 人 
谱系 和 古 世 界 猴 谱系 的 核 苷 酸 替 换 速率 。 在 所 有 检验 中 ,谱系 也 是 人 的 谱系 ,而 谱系 A 为 猴 的 谱系 。 
谱系 C 是 参照 物种 ( 见 表 下 的 注释 )。 因 此 ,速率 差 (KAc 一 Kac) 为 正 号 意味 着 人 谱系 曾 较 慢 地 进化 着 ， 
而 为 负 号 则 意思 相反 。 


表 4 一 6 古 世 界 猴 谱系 (A) 和 人 谱系 (B) 间 每 100 MANA RE FM (Kac— Kac)" 


顺序 位 点 数 KAB KAc 一 KBc 
人 站 珠 蛋 白 假 基因 2000 7.4 2 Bball 
同 义 位 点 
BRA 71 8.9 2: 85.6 
载 脂 蛋 白 A-i 158 7.9 =—§..da 408 
促 红细胞 生成 素 145 ‘A? S125. 9 
ma- 抗 胰 和 蛋白 酶 140 10.9 6.7 士 6.8 
胰岛 素 84 18. 6 a OsTen 
Aa F 
0- 珠 蛋白 601 4.7 3.4+1.4 
不 翻译 区 和 侧 区 域 
BEA 179 4.6 21. 7 
3- 珠 蛋白 172 8.8 6.1 士 3. 2 


总 计 3550 60:7 Zaz 0.16" ™ 


a. 所 用 参照 物种 为 泉 猴 (一 珠 蛋 白 假 基因 ), 狐 猴 (B 一 和 8 珠 蛋 白 ), 小 鼠 或 大 鼠 ( 促 红 细胞 生成 素 , 载 脂 蛋 白 A 一 I, 和 xl 一 抗 胰 
蛋白 酶 ) 和 狗 ( 胰 岛 素 ) 。 
** 在 1% 水 平 与 0 差异 显著 。 


我 们 注意 到 ,9 个 所 用 的 顺序 中 只 有 2 个 为 负 号 。 速 率 上 的 差异 即使 在 只 用 刀 假 基因 时 也 是 很 显著 
的 。 若 将 所 有 顺序 一 起 考虑 , 则 Kac—Kec=2. 3%, i Kas=6.7%. Ask. Hitt RRIBRA PH K (A 
(Koa) W(6. 7%+2.3%)/2=4.5%, AKA PAW K (A Kon) RA 6.7% —4.5% =2. 2%, HA RIBA 
以 4.5/2. 22 倍 于 人 谱系 的 速率 更 快 地 进化 着 。 


了 岩 齿 类 中 的 速率 高 于 灵 长 类 中 的 速率 


FAA Wu 和 Li,1985) 曾 用 相对 速率 测验 法 来 比较 员 齿 类 谱系 和 人 类 谱系 中 的 替换 速率 , 参 
照 物 则 用 偶蹄 类 或 食肉 类 谱系 。 他 们 的 结论 是 , 吗 齿 类 谱系 同 义 替 换 的 速率 约 为 人 类 谱系 的 2 倍 。 不 
过 要 注意 ,速率 上 的 估计 差异 指 长 期 内 ( 即 从 员 齿 类 一 灵 长 类 分 岐 到 现在 的 时 期 ) 的 平均 值 .由 于 在 发 
生 分 岐 的 那 一 时 期 和 其 后 的 短 时 期 里 两 谱系 中 的 替换 速率 应 是 相似 的 ,所 以 ,速率 差异 一 定 是 随时 间 
而 增加 的 。 因 此 ,以 上 估计 的 速率 差异 值 可 能 是 一 个 低估 值 。 要 想 知 道 更 近 时 期 的 速率 差异 ,我 们 需 
要 分 别 估 出 员 齿 动物 内 和 灵 长 动物 内 的 替换 速率 。 

表 4 一 7 展示 了 灵 长 类 和 吵 齿 类 中 的 替换 速率 的 比较 。 如 果 我 们 假定 人 一 黑猩猩 的 分 岐 发 生 在 七 
百 万 年 前 ,而 人 一 古 世 界 猴 的 分 岐 发 生 在 二 千 五 百 万 年 前 , 则 人 和 黑猩猩 的 顺序 间 平 均 速率 为 每 年 每 
位 点 1.3X10“ 替 换 , 而 人 与 古 世 界 猴 的 顺序 间 则 为 每 年 每 位 点 2.2X10“ 蔡 换 。 这 一 结果 与 古 世界 
猴 谱系 以 2 倍 于 人 谱系 的 速率 进化 的 结论 是 一 致 的 。 如 果 我 们 假定 小 鼠 一 大 鼠 的 分 岐 发 生 在 一 千 五 
百 万 年 前 , 则 小 鼠 和 大 鼠 的 顺序 间 平 均 速率 为 每 年 每 位 点 7.9X10 “ 蔡 换 。 因 此 , 趾 齿 类 中 的 速率 可 
能 是 较 高 等 的 灵 长 类 中 的 速率 的 4 到 6 倍 。 虽 然 关 于 所 用 的 分 岐 时 间 还 不 是 很 可 靠 , 但 吵 齿 类 顺序 的 
进化 比 灵 长 类 顺序 要 快 得 多 ,这 一 点 是 很 明显 的 。 


表 4 一 7” 灵 长 类 和 财 齿 类 中 每 年 每 位 点 同 义 蔡 换 的 平均 速率 


物种 对 位 点 数 百分比 分 岐 蔡 换 速率 (X10-9) 
人 对 黑猩猩 921 1.9 1. 3(0. 9 一 1. 9)b 
人 对 古 世 界 猴 998 11.0 2.2(1. 8 一 2. 8) 


小 鼠 对 大 鼠 3886 2357 7. 9(3. 9 一 11.8) 
自 Li 等 (1987a) 
a. 所 用 分 岐 时 间 , 人 一 黑猩猩 为 7(5 一 10) 百 万 年 前 ,人 一 古 世 界 猴 为 25(20 一 30) 百 万 年 前 ,小 鼠 一 大 鼠 为 15(10 一 30) 百 万 年 


前 。 
b. 括号 内 的 值 为 从 分 岐 时 间 的 上 限 估 值 和 下 限 估 值 得 到 的 速率 估 值 构成 的 范围 。 


不 同 进化 谱系 间 蔡 换 速率 上 出 现 变异 的 原因 


猴 的 替换 速率 高 于 人 的 以 及 吵 齿 类 的 替换 速率 高 于 灵 长 类 的 ,这 也 许 能 用 所 谓 世 代 时 间 效 应 
(generation-time effect) 来 加 以 解释 ( 儿 ohne,1970) 。 路 齿 类 的 世代 时 间 比 人 的 要 短 得 多 ,所 以 ,如 果 在 
这 些 生 物 间 每 世代 的 种 系 复制 没有 很 大 差别 的 话 , 则 每 年 的 种 系 DNA 复制 的 次 数 在 路 齿 类 中 就 可 
能 比 在 人 类 中 要 高 许多 倍 。 因 为 突变 大 多 在 DNA 复制 的 过 程 期 间 积累 ,所 以 ,复制 的 周期 数 越 多 , 则 : 
突变 错误 也 将 发 生得 越 多 。 这 一 因素 也 许 能 在 很 大 程度 上 解释 路 齿 类 的 替换 速率 高 于 人 类 的 替换 速 
率 的 现象 。 类 似 地 , 儿 有 比 人 短 的 世代 时 间 , 所 以 ,应 该 预期 它 将 有 较 高 的 替换 速率 。 

替换 速率 上 的 差异 也 可 部 分 地 归 因 于 DNA 修复 系统 的 效率 方面 的 差异 (Britten ,1986)。 已 有 的 
有 限 资料 表明 Ma RA Eh ARIK DNA 修复 系统 ,因而 ,在 每 一 复制 周期 中 将 积累 更 多 突变 。 

以 上 结果 不 应 拿 来 作为 不 存在 分 子 钟 的 证 据 。 我 们 注意 到 ,替换 速率 上 的 差异 是 在 具有 很 不 相同 
的 世代 时 间 的 生物 间 被 观察 到 的 。 当 具有 相近 的 世代 时 间 的 生物 , 象 小 鼠 和 大 鼠 进行 比较 时 ,速率 恒 
定 规律 表现 得 相当 明显 。 所 以 ,虽说 没有 一 个 关于 所 有 哺乳 类 的 全 球 性 时 钟 ,但 关于 许多 亲缘 关系 较 
近 的 物种 类 群 的 地 方 性 时 钟 也 许 是 存在 的 。 


4.5 细胞 器 DNA 中 的 替换 速率 


与 细胞 核 基 因 组 相 比 ,细胞 器 基因 组 要 小 得 多 ,也 更 容易 进行 实验 研究 .而且 ,在 哺乳 动物 线粒体 
基因 组 中 蔡 换 速率 特别 高 (Brown 等 ,1979)。 这 一 发 现 激 起 了 人 们 对 细胞 器 DNA 的 进化 问题 的 更 大 
兴趣 。 

哺乳 动物 线粒体 基因 组 由 一 个 环 状 、 双 链 DNA 组 成 。 长 为 15,000 一 17,000 碱 基 对 (bp) ,近似 地 
相当 于 最 小 的 动物 细胞 核 基 因 组 的 1/10,000。 它 只 含有 单一 的 ( 即 非 重复 的 ) 序 列 :13 个 为 蛋白 质 纺 
码 的 基因 ,2 个 rRNA 基因 ,22 个 tRNA 基因 和 一 个 调控 区 ,后 者 含有 复制 和 转录 的 起 始 位 点 。 该 基 
因 组 在 结构 上 是 非常 稳定 的 ,这 一 点 ,从 不 同 种 的 哺乳 动物 间 其 基因 组 大 小 变异 不 大 即 可 看 册 。 

与 其 成 鲜明 对 照 的 是 ,植物 的 线粒体 基因 组 却 展现 出 较 大 的 结构 变异 性 。 它 们 经 历 了 频繁 的 重 
HE. 重复 和 缺失 (Palmer,1985)。 为 此 ,基因 组 大 小 在 40,000bp 到 2,500,000bp 的 范围 内 变化 .植物 中 
的 线粒体 基因 组 可 能 是 线 状 的 ,也 可 能 是 环 状 的 ,而 在 许多 情况 中 ,遗传 信息 被 分 割 成 相互 独立 的 
DNA 分 子 , 后 者 被 称 为 亚 基因 组 环 。 植 物 线粒体 的 编码 内 容 还 没有 全 部 确定 ;不 过 ,我 们 确 已 知道 ,有 
3 个 确定 TRNA 的 基因 、 数 目 还 不 清楚 的 tRNA 基因 和 大 约 15 个 一 30 个 为 蛋 和 白质 编 码 的 基因 ,其 中 
有 些 已 被 鉴别 出 来 了 。 (在 植物 线粒体 基因 组 中 结构 基因 可 能 以 多 重 拷贝 出 现 .) 目 前 ,尽管 植物 线 粒 
体 基 因 组 在 大 小 上 有 很 大 变异 性 ,但 在 编码 内 容 上 却 没 有 表现 出 性 质变 异 的 迹象 ， 

维 管 植物 的 叶绿体 基因 组 是 环 状 的 ,大 小 在 120,000 到 220,000bp 的 范围 内 变化 ,平均 大 示 为 
1505000bp(Palmer,1985)。 尽 管 在 大 小 上 有 如 此 大 的 变异 ,但 该 基因 组 已 知 在 结构 上 是 稳定 的 。 烟草 
(Nicotiana iabpacxzz) 的 叶绿体 基因 组 已 经 被 完全 定 序 了 (Shinozaki 等 ,1986)。 它 是 一 个 环 状 分 子 ,长 
155,844bp 含有 37 个 tRNA 基因 (其 中 8 个 含有 单 内 含 子 ) ,8 个 rRNA 基因 ,和 45 个 为 蛋白 质 编码 
的 基因 [其 中 5 个 含有 单 内 含 子 ,其 中 2 人 站 含有 两 内 含 子 ) 。 两 条 链 都 用 于 编码 。Nizcoriazna tabacum 的 
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叶绿体 基因 组 还 含有 59 个 功能 不 知 的 外 加 开 读 框架 ,其 中 2 个 则 捅 进 了 内 含 子 。 

哺乳 动物 线粒体 基因 中 同 义 替 换 的 速率 已 估 出 ,为 每 年 每 同 义 位 点 5.7X10 8 HR (Brown 等 ， 
1982)。 这 大 约 是 细胞 核 中 为 蛋白 质 编 码 的 基因 的 同 义 替 换 值 的 10 倍 。 非 同 义 替 换 的 速率 在 13 个 为 
蛋白 质 编码 的 基因 中 变化 很 大 ,但 通常 都 比 细胞 核 基 因 的 平均 非 同 义 替 换 速 率 大 得 多 .哺乳 动物 线 粒 
体 中 这 些 高 替换 速率 的 原因 ,看 来 是 相对 于 细胞 核 而 言 它 有 较 高 的 突变 率 。 高 突变 率 则 是 由 于 (a) 线 
粒 体 中 的 DNA 复制 过 程 保 真 度 低 ,(b) 缺 乏 修复 机 制 或 修复 机 制 效率 极 差 ,和 (c) 诱 变 剂 浓度 高 ( 例 
如 超 氧化 物 基 团 O, ) ,后 者 是 线粒体 执行 代谢 功能 的 结果 。 另 一 方面 ,作用 在 非 同 义 突变 上 的 纯洁 化 
选择 的 强度 ,看 来 与 作用 在 细胞 核 基 因 上 的 属 同一 数量 级 。 

根据 几 个 基因 顺序 或 限制 酶 图 谱 资料 进行 的 早期 研究 指出 ,叶绿体 基因 有 上 比 哺乳 动物 细胞 核 基 
FA AFG AY 4% FF PR FR EK (Curtis 和 Clegg,1984;Palmer,1985) ,用 核 苷 酸 蔡 换 表 示 则 植物 线粒体 DNA 
进化 缓慢 ,虽然 它 频 繁 地 经 历 着 顺序 重 排 (Palmer 和 Hebron ,1987)。 这 些 结果 近 来 被 更 广泛 的 DNA 
顺序 分 析 所 证 实 (Wolfe 等 ,1987,1989) 。 

表 4 一 8 展示 了 高 等 植物 的 这 3 种 基因 组 中 替换 速率 的 比较 。 每 非 同 义 位 点 的 平均 替换 数 (KA) 
在 叶绿体 和 线粒体 基因 组 中 是 相似 的 ,但 每 同 义 位 点 的 平均 替换 数 (K.) 却 很 不 相同 ,在 单子 叶 植物 与 
双子 叶 植 物 间 比 较 , 叶 绿 体 基 因 组 中 的 开 . 几乎 是 线粒体 基因 组 中 的 3 倍 ; 而 在 玉米 与 小 麦 或 大 麦 间 
比较 则 前 者 是 后 者 的 6 倍 。 以 下 ,我 们 将 采用 前 一 个 比值 ,因为 它 是 根据 更 大 的 数据 组 而 得 到 的 。 植 
物 细 胞 核 基 因 中 的 平均 同 义 替 换 速 率 约 为 叶绿体 基因 的 4 倍 。 于 是 植物 线粒体 .叶绿体 和 细胞 核 基因 
中 的 同 义 蔡 换 速 率 , 近 似 地 呈 1 :3:12 这 样 的 比例 。 

表 4 一 8 植物 叶绿体 、 线 粒 体 和 细胞 核 基 因 中 核 背 酸 蔡 换 速率 的 比较 ” 


基因 组 Ks Ls Ka i 
单子 叶 与 双子 叶 植物 间 的 比较 

叶绿体 基因 0.58+0.02 4177 0.05+0.00 14421 

线粒体 基因 0.2140.01 1219 0.04+0.00 4380 
玉米 与 小 麦 或 大 麦 间 的 比较 

细胞 核 基 因 0.7140.04 1475 0.06+0.00 5098 

叶绿体 基因 0.17+0.01 2068 0.01+0.00 7001 

线粒体 基因 0 OF 2413 0.01+0.00 1526 


B Wolfe , (1987,1989b) 

a. 开 ,: 每 同 义 位 点 的 蔡 换 数 ;KA: 每 非 同 义 位 点 的 蔡 换 数 ;L.: 同 义 位 点 数 ;LA: 非 同 义 位 点 数 。 

如 果 我 们 把 玉米 与 小 麦 间 的 分 岐 时 间 取 为 50 一 70 百 万 年 (Stebbins ,1981;Chao 等 ,1984) , 那 
么 , 表 4 一 8 中 关于 细胞 核 的 数据 则 表现 出 一 个 每 年 每 位 点 5.1 一 7.1X10“ 替 换 的 平均 同 义 速率 。 这 
与 在 哺乳 类 细胞 核 基 因 中 看 到 的 同 义 蔡 换 速 率 ( 表 4 一 1) 相 似 。 

有 趣 的 是 ,细胞 器 的 基因 组 中 核 苷 酸 替 换 的 速率 与 结构 变化 的 速率 无 关 。 在 哺乳 类 中 ,以 核 苷 酸 
替换 表示 的 线粒体 DNA 的 进化 非常 迅速 ,但 其 基因 的 空间 排列 和 基因 组 的 大 小 却 在 各 物种 间 保 持 
稳定 。 相 反 , 植 物 的 线粒体 基因 组 经 历 了 频繁 的 结构 变化 ,但 其 核 苷 酸 替 换 速 率 却 极 低 。 在 叶绿体 
DNA 中 , 核 苷 酸 蔡 换 速 率 和 结构 进化 都 很 缓慢 .替换 速率 和 结构 进化 速率 间 无 相关 性 ,这 表示 两 个 过 
程 是 独立 地 进行 的 。 


4.6 假 基 因 中 的 核 苷 酸 蔡 换 模式 


因为 点 突变 是 DNA 序列 进化 中 最 重要 的 因素 之 一 ,所 以 分 子 进化 学 家 们 长 期 以 来 一 直 对 决定 
自发 突变 的 模式 (pattern of spontaneous mutation) 怀 有 兴趣 (例如 ,Beale 和 Lehmann,1965; Zuck- 
erkandl 等 ,1971)。 该 模式 可 以 被 当 作 一 个 标准 ,用 于 推论 : 任 一 给 定 DNA 序列 中 核 背 酸 间 相互 变换 
的 观察 频率 与 在 无 选择 下 , 即 在 选择 中 性 (selective neutrality) 下 ,预期 的 值 究竟 偏离 多 远 。 


研究 点 突变 模式 的 途径 之 一 ,是 检验 不 受 选 择 限 制 的 DNA 区 域 中 的 替换 模式 。 假 基因 在 这 里 特 
别 有 用 。 由 于 它们 无 功能 ,所 以 ,所 有 发 生 在 假 基 因 中 的 突变 都 是 选择 中 性 的 , 且 以 相同 的 概率 在 群体 
中 固定 。 于 是 , 假 基因 中 的 核 苷 酸 蔡 换 模式 预期 将 反映 出 自发 点 突变 的 模式 。 

图 4 一 7 表示 推论 假 基因 序列 中 的 核 苷 酸 桩 换 的 一 种 简单 方法 (Gojobori 等 ,1982;Li 等 ,1984)。 
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序列 1 序列 2 序列 3 
( 假 基 因 ) (有 功能 的 ) 〈 有 功能 的 ) 
图 4 二 7 推论 假 基 因 序 列 中 核 音 酸 堆 换 模 式 的 系统 笠 ” 虚 线 的 含义 是 无 功能 。 


序列 1 是 一 个 假 基因 ,序列 2 是 其 有 功能 的 对 应 物 ,来 自 同 一 物种 ,而 序列 3 则 是 假 基因 出 现 前 即 发 
生 分 岐 的 功能 序列 。 假定 在 某 一 核 苷 酸 位 点 上 ,序列 1 和 2 分别 各 为 A 和 G. 那 么 ,我 们 可 以 假定 , 若 
序列 3 中 该 位 点 上 为 G 则 假 基 因 序 列 中 该 核 苷 酸 从 GEA AMARA 3 中 该 位 点 上 为 A 则 序列 2 
PARRA A 变 成 G。 不 过 ,如 果 序 列 3 中 的 是 工 或 C, 则 我 们 不 能 决定 变化 的 方向 ,而 车 出 现 这 
种 情况 则 该 位 点 将 从 比较 中 排除 。 由 于 假 基 因 中 的 替换 速率 通常 大 大 高 于 其 同 源 的 功能 基因 中 的 速 
率 , 所 以 ,一 个 基因 与 一 个 假 基 因 间 核 苷 酸 顺 序 上 的 差异 ,在 绝 大 多 数 情 况 下 都 被 认为 是 假 基因 中 的 
改变 所 造成 的 。 

表 4 一 9 中 的 和 矩阵 代表 从 13 种 哺乳 类 假 基 因 序列 推 论 出 的 替换 的 联合 模式 。 抢 阵 中 的 每 一 个 项 
和 ,都 代表 一 个 随机 序列 ( 即 四 种 碱 基 以 相同 的 频率 出 现 其 中 的 序列 ) 中 每 100 次 替换 里 碱 基 从 i 变 成 
j 的 期 望 次 数 。 例 如 ,far 一 4.7, 表 示 所 有 替换 的 4.7%% 为 从 A BMT. 

表 4 一 9 假 基 因 中 的 替换 模式 


到 

从 A Ae ( G 行 总 计 
4.7 士 1.3 5.0+0.7 9.4+1.3 19.1 
(5.341.4) \Gi6+0.8) (10.821.4)-° °(21.2) 
本 Ae Ae 8. 2+1.3 3. 3 士 1. 2 15. 9 
(4.8+1.1) (9241.3) (3.641.383) . (17:6) 
A 6.5+1.1 21.0+2.1 4.2+0.5 3h 7 
(7141: 3) (C18. 2352989 (4. 2+0. 6) (29.5) 
a 20.742.2 7.24+1.1 5.3+1.0 33. 2 
(18.64£1.9) (7.741.3) (5.541. 3) (31. 8) 

31.6 32.9 18.5 16.9 

列 总 计 
(30.5) (31. 2) (20. 3) (18. 1) 


A Gojobori “ , (1982) Al Li , (1984) 
ae 表 中 项 为 以 13 种 哺乳 类 假 基 因 序 列 为 根据 推论 出 的 , 碱 基 从 i 变 为 j 的 百分数 (fi)。 括 号 中 的 值 是 把 所 有 CG BE RIA 
中 排除 后 得 到 的 。 


我 们 注意 到 ,突变 的 方向 是 非 随机 的 。 例 如 ,A 变 成 G 比 变 成 工 或 C 更 常 发 生 。 从 右上 角 到 左下 

角 的 对 角 线 上 的 4 个 元 是 转换 的 加 值 , 其 余 的 8 个 元 代表 颠 换 。 所 有 转换 ,特别 是 C~>T 和 G->A，, 都 

比 颠 换 更 常 发 生 。 转 换 的 相对 频率 之 和 为 59.2% ( 若 CG 二 核 苷 酸 被 排除 则 为 54.4% , 见 下 )。 我 们 

注意 到 在 随机 突变 下 转换 的 期 望 比 例 仅 33%% ,因为 只 有 4 种 转换 却 有 8 种 颠 换 。 该 观察 比例 几乎 是 

在 随机 突变 下 预期 值 的 两 倍 。 

我 们 也 注意 到 ,有 些 核 苷 酸 比 另 一 些 要 更 容易 突变 。 在 表 4 一 9 的 最 后 一 列 ,我们 列 出 了 从 ATA 
。54。 


C 和 6G 突变 成 别 的 核 苷 酸 的 相对 频率 。 如 果 4 种 核 苷 酸 都 有 相同 的 突变 性 , 则 我 们 应 期 望 该 列 中 的 每 
一 个 元 都 有 一 个 25%% 的 值 .实际 上 ,我们 看 到 ,G 以 33. 2 儿 的 相对 频率 突变 ( 即 ;G 是 一 种 高 可 突变 的 
核 背 酸 ) ,而 工 则 以 15.9%% 的 相对 频率 突变 ( 即 它 达 不 到 那 种 可 变 程度 )。 HEHE A—-9 的 最 后 一 行 ,我 们 
列 出 了 所 有 经 突变 而 变 成 AT.C AG 的 相对 频率 。 我 们 注意 到 ,所 有 突变 的 64.5%% 是 变 成 A 或 1 
的 ,而 随机 过 程 期 望 的 值 应 为 50% 。 由 于 C 和 G 有 一 种 频繁 地 变 成 A 或 工 的 倾向 ,又 由 于 A AT AH 
如 C 和 G 那 样 可 突变 ,所 以 , 假 基因 预期 应 变 得 富 含 A 和 T 工 .这 对 其 他 一 些 不 受 功 能 限制 的 非 编 码 区 
应 该 也 是 成 立 的 。 事 实 上 , 非 编 码 区 普遍 发 现 是 富 AT 的 。 

表 4 一 9 中 的 结果 是 根据 有 意义 的 链 , 即 未 被 转录 的 链 而 得 出 的 。 所 以 ,从 G 到 和 A 的 变化 实际 上 
意味 着 一 个 G:C 对 被 一 个 A:T 对 所 取代 。 这 种 情况 的 出 现 , 可 以 是 有 意义 的 链 中 G 突变 成 A 的 结 
果 , 也 可 能 是 与 前 者 互补 的 链 中 C 突变 成 工 的 结果 。 类 似 地 ,从 C 到 工 的 变化 ,也 可 能 是 在 一 条 链 中 
C 突变 成 工 或 在 另 一 条 链 中 G 突变 成 A 的 结果 。 如 果 两 条 链 间 突变 的 模式 没有 差别 ,那么 我 们 应 有 
fcA 王 fcr。 类 似 地 ,我们 应 能 得 到 fac 一 frcsfAr 一 frA,fAc 一 freyfcA 一 fcr 和 fcc 王 fcc。 这 些 等 式 仅 近 似 地 成 
立 , 且 事实 上 这 两 条 链 间 的 突变 模式 可 能 存在 较 小 的 不 对 称 性 。 这 种 不 对 称 性 可 能 是 由 于 DNA 复制 
期 间 ,先导 链 和 滞后 链 间 在 复制 机 制 方面 有 差异 所 造成 (Wu 和 Maeda, 1987). 

已 知 从 C 到 工 的 转换 ,除了 碱 基 误 配 以 外 ,还 可 能 是 从 甲 基 化 了 的 C 残 基 经 脱 氨 而 变 成 工 残 基 ， 
这 样 一 种 转变 过 程 而 实现 的 (Coulonder 等 ,1978;Razin 和 Riggs,1980) 。 该 作用 将 提高 C:G->T 工 :A Al 
G:C>A:T. Bil fer All fox 3. HF AE RE DH DNA 中 约 90% WY EAL AY C RAE RHE TE 5’— CG) 
一 3 二 核 苷 酸 中 (CRazin 和 Riggs,1980), 所 以 ,该 效应 将 主要 以 CG — KH B® MK TG 或 CA 的 形式 
表现 出 来 。 一 个 基因 变 成 假 基因 后 ,这 类 变化 将 不 再 受 任何 功能 限制 ,因而 ,如 果 在 基因 的 沉默 化 (si 
lencing)( 即 失去 功能 ) 发 生前 CG 的 频率 相对 而 言 较 高 , 则 它 能 为 CT 工 和 G->~A 转换 作出 显著 贡献 。 
对 看 来 曾 在 这 假 基 因 的 祖先 序列 中 出 现 过 CG 二 核 苷 酸 的 那些 位 点 予以 排除 ,由 此 而 得 到 的 替换 模 
式 在 表 4 一 9 的 括号 中 给 出 。 此 模式 也 许 更 适合 于 :预测 一 个 长 期 不 受 功 能 限制 的 序列 (例如 一 个 内 含 
子 的 某 些 部 分 ) 中 的 突变 模式 ,因为 在 这 样 的 序列 中 将 只 有 少量 CG SRK RATE. HERR CG 二 核 苷 
酸 后 得 到 的 模式 有 点 不 同 于 不 经 排除 而 得 到 的 模式 。 特 别 地 ,4 种 转换 间 的 相对 频率 差异 显著 性 略 有 
降低 ,而 各 颠 换 的 相对 频率 , 除 G->C 和 C>G 外 , 则 略 有 升 高 。 


4.7 同 义 密 码 子 的 非 随 机 应 用 


由 于 遗传 密码 的 简 并 ,20 种 氨基 酸 中 大 多 数 都 是 由 一 个 以 上 的 密码 子 编码 的 (第 一 章 )。 因 为 同 
义 突变 不 造成 氨基 酸 顺 序 中 的 任何 变化 , 且 因为 自然 选择 被 认为 主要 在 蛋白 质 水 平 上 起 作用 ,所 以 ， 
同 义 突变 曾 被 当 作 选择 上 呈 中 性 的 突变 的 候选 者 (Kimura,1968;King 和 Jukes,1969)。 然 而 , 若 所 有 ， 
同 义 突变 事实 上 都 是 选择 中 性 的 ,那么 ,为 同一 个 氨基 酸 编码 的 同 义 密码 子 就 应 该 以 多 少 有 点 相同 的 
频率 应 用 。 不 幸 的 是 , 随 着 DNA 顺序 资料 的 积累 ,逐渐 表明 同 义 密码 子 的 应 用 ,在 原核 生物 和 真 核 生 
物 的 基因 中 都 显然 是 非 随机 的 (Grantham 等 ,1980)。 事 实 上 ,在 许多 酵母 的 基因 和 大 肠 杆菌 的 基因 
中 ,应 用 上 的 偏 斜 是 极 显 著 的 。 例 如 ,在 大 肠 杆菌 CEschnerzchiza coli) > REA I Comp A) 中 的 23 个 亮 
酸 残 基 里 , 有 21 个 由 密码 子 CUG 编码 ,尽管 为 亮 氨 酸 编码 的 还 有 5 种 密码 子 。 这 种 偏 斜 不 能 用 非 随 
机 突变 来 解释 。 如 何 解 释 这 种 广泛 存在 的 密码 子 非 随机 应 用 现象 ,成 了 一 个 有 争议 的 问题 ,好 在 对 此 
间 题 看 来 已 出 现 了 一 些 明确 的 答案 。 

有 助 于 理解 非 随机 应 用 现象 的 一 个 观察 事实 是 ,一 个 生物 中 或 有 亲缘 关系 的 物种 中 的 基因 ,一般 
表现 出 对 同 义 密 码 子 的 选取 有 同样 的 模式 (Grantham 等 ,1980) 。 于 是 ,哺乳 动物 \ 大肠 杆菌 和 酵母 的 
基因 被 归 为 不 同 的 密码 子 应 用 类 型 。 格 兰 瑟 姆 等 (Grantham 等 ,1980) 因此 而 提出 了 基因 组 假说 
(genome hypothesis)。 按 其 假说 ,任何 给 定 基因 组 中 的 基因 在 同 义 密码 子 的 选取 方面 都 采用 同样 的 纺 
码 策略 , 即 在 密码 子 应 用 上 的 偏 斜 是 物种 特异 的 。 基 因 组 假说 被 证 明 一 般 说 来 是 正确 的 ,虽然 在 一 个 
基因 组 的 不 同 基因 间 密 码 子 应 用 有 着 相当 大 的 异 质 性 ( 见 下 面 )。 

大 肠 杆菌 和 酵母 中 密码 子 应 用 的 研究 , 极 大 地 增加 了 我 们 对 影响 同 义 密码 子 选取 的 因素 的 认识 。 
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波斯 特等 (Post 等 ,1979) 发现, 大 肠 杆 菌 核糖 体 蛋白 基因 ,优先 应 用 于 被 含量 最 多 的 tRNA 种 类 识别 
的 同 义 密 码 子 。 他 们 认为 ,这 种 偏向 是 自然 选择 的 结果 ,因为 应 用 由 含量 最 多 的 tRNA 种 类 翻译 的 密 
码 子 ,将 会 增加 翻译 的 效率 和 精确 性 。 他 们 的 发 现 曾 激励 池村 (kemura,1981,1982) 去 收集 有 关 大 肠 
杆菌 和 酵母 Saccharomyces cerevisiae ( Hie 74 BE AE) A tRNA 种 类 的 相对 丰 度 的 资料 。 他 证 明 , 在 这 两 
个 物种 中 ,一 个 基因 中 同 义 密码 子 的 相对 频率 与 识别 它们 的 tRNA 种 类 的 相对 丰 度 间 存 在 着 正 相 关 。 
对 于 高 度 地 表达 的 基因 而 言 , 这 种 相关 非常 强 。 例 如 ,在 大 肠 杆菌 中 4 种 亮 氨 酸 tRNA 里 含量 最 多 的 
是 tRNA , 它 识 别 CUG 密码 子 , 而 ompA 基因 也 主要 用 这 种 密码 子 为 亮 氢 酸 编码 ( 见 上 面 )。 
图 4 一 8 表示 6 个 亮 氨 酸 密码 子 的 频率 和 识别 它们 的 tRNA 的 相对 丰 度 间 的 对 应 关系 。 在 大 肠 杆 
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图 4 一 8 ”关于 亮 氨 酸 的 密码 子 应 用 的 相对 频率 ( 白 柱 体 ) 和 相应 的 识别 tRNA 种 类 的 相对 丰 度 ( 黑 柱 体 ) 间 关系 的 
图 解说 明 ,(a) 在 大 肠 杆 菌 中 和 (b) 在 Sacharomyces cerevisiae P Ao F (4) 40 E. coli 中 密码 CUC 和 CUU 间 的 符号 ) 表 

示 这 类 密码 子 对 中 的 密码 子 都 是 由 同一 种 tRNA 来 识别 的 (例如 , 瑟 . co 中 CUC 和 CUU 都 由 tRNA: 呈 来 识别 ) 。 
菌 中 ,tRNA "” 是 含量 最 多 的 tRNA 种 类 ,而 事实 上 ,在 高 水 平 表 达 的 基因 中 ,CUG( 由 这 种 tRNA if 
别 的 密码 子 ) 的 应 用 比 另外 5 种 密码 子 要 频繁 得 多 。 另 一 方面 ,在 酵母 中 ,含量 最 丰富 的 亮 氨 酸 tRNA 
种 类 是 tRNA, ,而 被 这 种 tRNA 识别 的 密码 子 (UUG) 也 是 数量 上 占 优 势 的 密码 子 。 对 比 之 下 ,在 以 
较 低 水 平 表 达 的 基因 中 ,tRNA 丰 度 和 各 密码 子 间 的 对 应 在 这 两 个 物种 里 都 要 弱 得 多 (图 4 一 8)。 

在 决定 高 水 平 表 达 的 基因 中 密码 子 的 应 用 模式 方面 ,翻译 效率 的 重要 性 已 得 到 以 下 观察 的 进 一 
步 支 持 (Ikemura,1981) 。 已 知 密码 子 - 反 密码 子 配对 在 第 3 位 上 出 现 摇 摆 (wobbling) 。 例 如 , 反 密 码 子 
的 第 工 位 上 的 U 既 可 与 A 也 可 与 G 配 对 。 类 似 地 ,G 既 可 与 C 也 可 与 U 配对 。 但 是 , 反 密 码 子 第 1 位 
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上 的 C 则 只 能 与 密码 子 第 3 位 上 的 G 配 对 ,以 及 A 只 能 与 可 配对 。 播 摆 还 可 能 通过 这 样 的 事件 来 实 
现 :有 些 tRNA 在 第 1 反 密 码 位 置 上 含有 经 修饰 过 的 碱 基 , 而 这 类 tRNA 能 识别 一 种 以 上 的 密码 子 。 
例如 ,次 黄 味 叭 (一 种 经 过 修饰 的 腺 味 叭 ) 可 与 U`C\A 三 种 碱 基 中 的 任何 一 种 配对 。 有 趣 的 是 ,大 多 
数 能 识别 一 种 以 上 密码 子 的 tRNA ,都 表现 出 对 其 中 的 某 一 种 有 不 同 的 偏爱 。 例如 , 反 密 码 子 的 摇摆 
位 置 上 的 4 一 硫 尿 喀 啶 (SU) ,可 以 识别 密码 子 播 摆 位 置 上 的 A 和 Gy; 然而 ,与 以 G 结尾 的 密码 子 相 
比 , 它 对 以 A 结尾 的 密码 子 表现 出 明显 的 偏爱 。 这 种 偏爱 在 高 度 地 表达 的 基因 中 应 会 反映 出 来 . 大肠 
杆菌 中 两 个 为 赖 氨 酸 编码 的 密码 子 是 由 一 种 tRNA 识别 的 ,该 tRNA 分 子 在 反 密 码 子 的 摇摆 位 置 上 
有 S4U ,而 事实 上 ,在 大 肠 杆菌 的 omzp A 基因 中 ,19 个 赖 氨 酸 密码 子 里 15 个 是 AAA, 只 有 《4 个 是 
AAG 。 

表 4 一 10 列 出 了 由 夏普 等 (Sharp 等 ， 1988) 广 泛 收集 的 密码 子 应 用 资料 中 的 一 部 分 。 对 每 一 组 同 
义 密码 子 来 说 ,如 果 应 用 机 会 均等 , 则 每 种 密码 子 的 相对 频率 应 该 是 1。 然 而 ,大 多 数 情况 下 显然 并 非 
如 此 。 而且; 在 大 肠 杆 菌 和 酵母 这 两 个 物种 中 ,密码 子 应 用 偏 斜 都 是 在 高 水 平 表 达 的 基因 中 比 在 低 水 
平 表达 的 基因 中 更 严重 .对 此 差异 的 一 个 简单 解释 是 ,在 高 水 平 表达 的 基因 中 对 翻译 效率 和 精度 的 选 
择 要 强 一 些 , 所 以 密码 子 应 用 偏 斜 也 就 显著 一 些 。 另 一 方面 ,在 低 水 平 表 达 的 基因 中 选择 相对 而 言 较 
弱 , 所 以 ,该 应 用 模式 主要 受 选择 压力 和 随机 遗传 漂 变 的 影响 ,因而 偏 斜 程度 也 低 一 些 (Sharp 和 Li, 
1986). 

表 4 一 10 .4 个 物种 中 的 密码 子 应 用 ” 


氨基 酸 - 密码 子 Escherichia Coli Saccharomyces Cerevisiae Drosophila Melanogaster 人 

高 低 高 低 sy 低 G+C A+T 

Leu UUA 0.06 1. 24 0. 49 1.49 0. 03 0. 62 0. 05 0. 99 
UUG 0,07 0. 87 5. 34 1.48 0. 69 1.05 0.31 oy Hyon 

cou “0 13 0.72 0.02 . 073 0. 25 0. 80 0. 20 1.26 

Bue 017-0. 65 0. 00 0.51 0.72 0. 90 1. 42 0. 80 
CUA. 0.04 0.31 0.15 0. 95 0. 06 0. 60 0.15 , £0.57 

CUG 5.54 2. 20 0.02 °° 0.84 4.25 2. 04 3. 88 1. 38 

Wa \aGOU 241 1.09 2.07 1.13 0. 56 0.74 0. 09 1. 32 
GUC 0.08 0.99 1.91 0:76 , ‘1.59 0. 93 1. 03 0. 69 

GUA 1.12 0. 63 0. 00 1,18: © :0..06 0.53; 0.11 0. 80 

GUG ~ *0. 40 1.29 0. 02 0.93 1.79 1. 80 2.78 1.19 

Ile AUU 0.48 1. 38 1.26 1.29 0.74 Doe 0.45 1. 60 
AUC 2.51 1.12 1.74 0. 66 2. 26 0. 95 2.43 0.76 

AUA _ 0.01 0.50 . 00 1.05 0. 00 0. 78 0.12 0. 64 

Phe ©UUU 0.34 133. «(0.19 1. 38 0.12 0. 86 0.27 1.20 
UUC 1.66 0. 67 1.81 0. 62 1. 88 1.14 1.73 0. 80 

Met AUG 1.00 1.00 1.00 1.00 1.00 1. 00 1.00 » 1.00 


A Sharp # , (1988) 

a. 对 每 一 同 义 密码 子 组 来 说 ,相对 频率 之 和 等 于 该 组 中 的 密码 子 数 。 例 如 , 亮 氨 酸 有 6 个 密码 子 , 所 以 关于 这 6 个 密码 子 的 相对 频率 
之 和 即 应 为 6。 在 均等 地 应 用 下 ,一 组 中 每 一 密码 子 的 相对 频率 应 为 1, 所 以 各 值 与 1 的 偏差 指示 应 用 上 偏 斜 的 程度 。 高 和”* 低 "表示 
以 高 水 平 表 达 和 以 低 水 平 表 达 的 基因 。 对 人 来 说 ，“G 十 C?" 意 味 着 高 GC 区 ,而 “A 十 IT 意味 着 高 AT 区 。 


总 之 ,在 大 肠 杆菌 和 酵母 中 , 同 义 密码 子 的 选取 受 着 RNA 可 用 性 和 其 他 与 翻译 效率 有 关 的 因素 
的 限制 。 这 些 限制 结果 将 以 纯洁 化 选择 表现 出 来 ,从 而 减缓 了 同 义 替 换 的 速率 (Ikemura,1981;Kimu- 
ra,1983)。 事 实 上 ,已 经 得 到 证 明 的 是 , 肠 道 细菌 的 基因 中 同 义 替 换 的 速率 与 密码 子 应 用 的 偏 斜 程度 
#2 ff #3 (Sharp #l Li, 1986). ELS Saami ee trea BLL a 
学 说 的 证 据 , 因 为 它 可 用 选择 限制 越 强 结果 进化 速率 就 越 低 这 一 原理 来 加 以 解释 ( 见 第 TH 
Kimura; 1983) 。 

表 4 一 10 5B FR AB HY, FRR HP BY Hi BY EF AK de aS 029 AE GE AIR OF de aS 2 TA He 
重 得 多 ,这 指出 对 翻译 效率 的 选择 在 决定 这 种 生物 里 同 义 密 码 子 的 选取 方面 也 起 重要 作用 。 


在 许多 人 的 基因 中 ， 密码 子 倾向 于 以 G 或 C 结尾 ( 即 在 第 3 位 置 上 有 较 高 的 GC 含量 )， 而 在 另 一 
些 基因 中 却 有 较 低 的 第 3 位 置 GC 含量 。 不 过 ,有 几 种 原因 可 用 来 说 明 为 什么 该 偏 斜 可 能 与 基因 表达 
的 水 平 无 关 。 首 先 ,ae 一 和 B 一 珠 蛋 白 基 因 在 密码 子 的 第 3 位 上 有 不 同 的 GC 含量 (分 别 为 高 含量 和 低 
含量 ) ,但 它们 在 同样 的 组 织 ( 红 细胞 ) 中 以 近似 相等 的 量 表达 ,因而 它们 应 该 有 相同 的 表达 水 平 。 其 
次 ,在 鸡 的 基因 中 ,密码 子 应 用 的 频率 与 tRNA 的 可 用 性 无 关 (Ouenzar 等 ,1988)， 虽然 该 观察 也 许 不 
能 直接 地 用 诗人 的 基因 。 最 后 ,第 3 密码 子 位 置 上 的 GC 含量 与 侧 区域 中 和 肉 含 子 中 的 GC 水 平 有 很 
强 的 相关 性 (第 八 章 ,Bernardi 和 Bernardi, 1985;Aota 和 Ikeimura,1986 ) 。 例如 ,oa 一 珠 蛋 白 基 因 GC 含 
量 高 且 它 位 于 高 GC 区 域 ,B 一 珠 蛋 白 基 因 GCC 含量 低 而 它 位 于 低 GC 区 域 ( 第 八 章 ,Bernardi 等 ; 
1985) 。 计 是 ,看 来 人 基因 中 的 密码 子 应 用 偏 斜 , 极 大 地 因 含 有 该 基因 的 区 域 中 GC 的 含量 而 决定 。 正 
如 将 要 在 第 八 章 讨论 的 那样 ,一 个 区 域 中 的 GC 含量 是 由 自然 选择 还 是 由 突变 偏 斜 所 决定 ,这 仍 是 一 
个 有 争议 的 问题 。 不 过 ,由 于 一 个 基因 中 第 3 密码 子 位置 上 的 GC 含量 倾向 于 高 于 其 周围 区 域 中 的 含 
量 ( 第 作 章 ;Aota 和 全 emura,1986), 所 以 ,有 可 能 人 的 基因 中 密码 子 应 用 模式 受到 某 种 程度 的 自然 先 
择 的 影响 。 要 得 到 对 影响 人 中 密码 子 应 用 的 因素 的 更 多 知识 ,还 需要 做 进一步 的 研究 。 


习题 


1. 等 式 4.1 的 分 母 为 什么 是 2T AAT? 

2. 图 4 一 9 表示 来 自 橄榄 狮 卯 CPazzo anubis) Mi 5 KBE (Pongo pygmaeus) 61 一 珠 蛋白 基因 
的 第 1 和 第 2 外 显 子 的 DNA 顺序 。 用 一 参数 模型 分 别 算出 3 个 密码 子 位 置 中 每 一 个 的 每 位 点 替换 
数 。 哪 一 个 位 置 进化 得 最 快 ? Ata? 


b: ATG GCG CTG TCC GCG GAG GAC CGG GCGGCT GTG CGC GCC CTG 
o: ATG CGC CTG TCC GCG GAG GAC CGG GCGCTG GTG CGT GCC CTG 


b: TGG AAG AAA CTG GGA AGC AAT GTT GGCGTC TAT GCT ACT GAG 
o: TGG AAG AAG CTG GGC AGC AAC GTC GGCGTC TAC ACG. ACA GAG 


b: GCC CTG GAG AGG ACC TTC CTG GCT TTCCCC GCC ACG AAG ACC 
o; GCC CTG GAG AGG ACC TTC CTG GCC TTCCCC GCA ACG AAG ACC 


b: TAC TTC TCC CAC CTA GAC CTG AGC CCCGGC TCC GCC CAG GTT 
o: TAC TTC TCC CAC CTG GAC CTG AGC CCCGGC TCC TCA CAG GTC 


b; AGA GCA CAC GGC CAG AAG GTG GCG GACGCG CTG AGC CTC GCC 
o: AGA GCC CAC GGC CAG AAG GTG GCG GACGCG CTG AGC CTC GCC 


b; GTG GAG CGC CTA GAC GAC CTA CCC CGCGCG CTG TCC GCT CTG 
o: GTG GAG CGC CTG GAC GAC CTA CCC CACGCG CTG TCC GCG CTG 


b; AGC CAT CTG CAC GCT TGC CAG CTG CGAGTG GAC CCA GCT AAC 
o: AGC CAC CTG CAC GCG TGC CAG CTG CGAGTG GAC CCG GCC AGC 


b: TTC CCG 
o; TTC CAG 


图 4 一 9 A&E MHL (Cb) fo DRE B(C0)H O1L—-KREGKA PHRF 1 f 2% DNA MA, FARA Shaw 等 ， 
(1987) 4 Marks ¥ , (1986). 

3. 图 4 一 10 RAK A MHA REY 91 一 珠 蛋 白 基 因 中 第 1 SAB FH DNA 顺序 。 用 
Ca) 一 参数 模型 ,和 (b) 两 参数 模型 ,算出 替换 数 。 这 两 个 估计 有 差别 吗 ? 将 此 结果 与 你 在 习题 2 中 得 到 
的 结果 相 比 较 ,那么 ,该 内 含 子 的 进化 比 外 显 子 中 3 个 密码 子 位 置 上 的 进化 是 快 还 是 慢 ? 


。58 。 


b: TGCGGCGAGGCTGGGCGCCCCCGCCCTCCGGGGCCCTGCCTCCCCAAGCC 
o: TGCGGCGAGGCTGGGCGCCCCCGCCCCC-AGGGCCCTCCCTCCCCAAGCC 


b: CCCCGGACGCGCCTCACCGCCGTTCCTCTCGCAG 
o: CCCCGGACTCGCCTCACCCACGTTCCTCTCGCAG 


图 4 一 10 RA MRMHH (Df BREE (0)H 61 一 珠 蛋 白 基 因 中 第 1 个 内 含 子 的 DNA 顺序 。 一 个 裂 镍 用 - 标 出 。 资 料 
取 自 Shaw 等 ,(1987) 和 Marks 等 ,(1986) 

4. 图 4 一 11 表示 来 自 人 仓鼠, 大 鼠 和 小 鼠 的 核 仁 素 基 因 中 的 第 1 个 内 含 子 的 部 分 DNA MF. 以 仓 
鼠 的 顺序 作为 参照 物 , 用 相对 速率 检验 法 来 决定 ,大 鼠 谱系 和 小 鼠 谱 系 间 替换 速率 上 是 否 存在 差异 。 


m: GTAAGAGGCCTGGCGCGCCGACGCGGACGACTAGGCCTGCTTTCGGAGGG 
r: GTAATAGGCCTGACGCGCGAACACGGACGACTAGGCCTGCTTTCTGAGAG 
h: GTGAGAGGCCTCGCGCGCGCCGACGGACGGACGGGCCTGCTTTCTGAGGG 


m: GCGCGCGCGCCGTCGCGGAGGGGAGGAGGGCTTGCGCGCAATCCCGGGCG 
r: GCGCGCGCGCCGTCGCGGAGGGGAGGAGGGCCTGCGCACAGTCCCGGGCG 
h; GCGCGCGCGCGGTCGCTCAGGGGAGGAGGGCCTGCGCGCAA TCCCGGGCG 


m: CGTTCGAGGGCGCCAGCTGGGGAACTCTCGCGCGACT AGCGGGAGGTCTC 
r: CGTTCGAGGGCGCA TGCTGGGGAAGTCTCGCGCGACT AGCGGAGGGTCTC 
h: CGTTCGAGGGCGCA TGCTGGGGAAGTCTCGCGCGACTAGCGGAGGGTCTC 


图 4 一 11 ABDA(Mm). KAD PEACH HRERRA PRL 个 内 含 子 的 部 分 DNA 顺序 。 裂 名 (缺失 和 插入 ) 已 被 
略 去 。 资 料 取 自 Bourbon 等 ,(1988) 

5. 艾滋 (AIDS) 病 毒 的 两 个 品系 用 WMJ1 和 WMJ2 表示 ,在 1984 年 10 月 3 日 和 1985 年 1 月 15 
日 从 一 个 两 岁 的 孩子 身上 分 离 出 来 (Hahn 等 ,1986)。 这 个 孩子 假定 只 受过 一 次 感染 (由 她 的 母亲 在 
围 产 期 传 给 )。 这 两 个 分 离 物 间 外 壳 蛋 白 (exv) 基 因 中 每 同 义 位 点 的 同 义 替 换 数 为 0.0164(Li 等 ， 
1988) 。(a) 假 定 WMJ2 直接 从 WMJ1 进化 而 来 并 假定 这 两 个 顺序 在 1984 年 10 月 3 日 分 开 , 求 同 义 
替换 速率 的 最 大 估 值 。(b) 假 定 这 两 个 品系 在 被 感染 时 即 开始 分 岐 ,并 假定 它们 已 独立 地 进化 了 两 
年 , 求 该 基因 同 义 替 换 速 率 的 最 小 估 值 .这 些 蔡 换 速 率 比 对 哺乳 动物 的 基因 加 以 平均 的 同 义 替 换 速率 
( 表 4 一 1) 要 快 多 少 ? 

6. 从 大 肠 杆 菌 .酵母 和 人 中 各 找 出 一 个 完整 的 cDNA 或 基因 顺序 。 对 每 一 种 基因 编 一 个 密码 子 
应 用 表 ( 即 列 出 每 种 密码 子 在 基因 中 被 使 用 的 次 数 ) 。 那 么 ,该 密码 子 应 用 是 否 偏 斜 ? 在 哪 方 面 偏 斜 ? 
密码 子 应 用 模式 在 这 3 种 基因 中 是 否 相 似 ? MRAZ WER AX 检验 法 去 判断 ,在 每 一 种 基 
因 中 绩 氨 酸 密码 子 的 应 用 与 该 族 密码 子 机 会 均等 地 应 用 的 偏差 是 否 具 有 统计 学 意义 。 
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5 分子 系统 发 育 


分 子 系统 发 育 是 用 分 子 生 物 学 技术 对 生物 间 的 进化 关系 进行 的 研究 。 它 是 分 子 进化 中 的 一 个 领 
域 , 近 十 年 来 已 引起 了 广泛 关注 ,这 主要 是 因为 在 许多 情况 下 系统 发 育 关 系 用 任何 别 的 方法 都 难以 佑 
价 的 缘故 .本 章 的 目的 是 ,解释 如 何 用 分 子 数据 来 构建 系统 树 , 以 及 给 出 一 些 例子 ， ae 些 存在 
已 久 的 系统 发 育 问题 ,分 子 方法 能 够 提供 比 传统 方法 要 清晰 得 多 的 解答 。 


5.1 “分子 数 据 对 系统 发 育 研究 的 影响 


rT TET eae Lie 甚至 早 于 备 德 尔 定 律 被 重新 发 现 的 1900 年 。 免 疫 
化 学 研究 表明 ， 血清 学 交叉 反应 在 亲缘 关系 较 近 的 生物 间 比 在 关系 较 远 的 生物 间 强 。 这 些 发 现 的 进化 
含义 被 纳 托 尔 (Nutall,1904) 用 来 推论 各 不 同 动物 类 群 间 的 系统 发 育 关 系 。 例 如 ， 他 断定 人 类 最 近 乡 
的 亲属 是 猿 , 其 后 ,亲缘 关系 由 近 及 远 依 次 为 : 古 世 界 猴 ,新 世界 猴 和 原 猴 。 

自 十 九 世 纪 六 十 年 代 后 期 以 来 ,分 子 生物 学 中 的 各 种 技术 都 得 到 发 展 , 从 而 开始 了 将 分 子 数据 广 

应 用 于 系统 发 育 的 研究 .特别 是 在 十 九 世纪 七 十 年 代 和 十 九 世 纪 八 十 年 代 , 用 蛋白 质 顺序 资料 研究 
分 子 系统 发 育 进 展 极 快 。 花 费 不 大 但 便利 得 多 的 方法 , 象 蛋白 质 电 泳 ,DNA 一 DNA 杂交 和 免疫 学 方 
法 ,虽然 不 如 蛋白 质 顺 序 测定 来 得 精确 , 却 也 被 广泛 用 于 群体 间或 亲缘 关系 较 近 的 物种 间 的 系统 发 育 
关系 的 研究 中 。 这 些 方法 的 应 用 也 刺激 了 遗传 距离 的 测定 和 系统 树 构建 法 的 发 展 ( 见 ,Fitch 和 Margo- 
liash , 1967; Nei, 19755 Felsenstein , 1988) 。 

A+ Sth 40 /\ + 4 0 Je RY DNA 顺序 资料 的 积累 ， 已 经 对 分 子 系统 发 译 产 生 了 巨大 的 影 
Me]. DNA 顺序 资料 不 仅 更 为 丰富 ,而且 比 蛋 白质 顺序 资料 更 容易 分 析 。 因 此 ,它们 一 方面 已 被 用 于 推 
断 象 人 与 猿 那样 亲缘 关系 很 近 的 物种 间 的 系统 发 育 关 系 ( 见 第 72 页 ), 另 一 方面 又 被 用 来 研究 一 些 非 
常 古老 的 进化 事件 , 象 线粒体 和 叶绿体 的 起 源 ( 见 第 76 页 ), 门 和 界 的 分 化 (Woese,1987) 等 。 将 来 ， 
DNA 定 序 看 来 将 用 于 解决 系统 发 育 研究 中 许多 长 期 得 不 到 解决 的 问题 , 象 细菌 和 单 细胞 真 核 生 物 间 
的 进化 关系 (Sogin 等 ,1986,1989) ,这 用 任何 传统 的 进化 研究 方法 都 不 可 能 得 到 解决 。 事 实 上 ,分 子 
oh paeennale Cae eS ee be ee RS Ra eae 

的 系统 发 育 树 。 

当然 ,我 们 也 不 放弃 进化 研究 的 传统 手段 ,象形 态 学 .解剖 学 .生理 学 和 古生物 学 等 。 因 为 ， 不 同方 
法 可 提供 互相 补充 的 数据 。 我 们 注意 到 ,分 类 学 主要 以 形态 学 和 解剖 学 资料 为 依据 5 而 古生物 学 信息 
则 是 能 提供 用 于 进化 研究 的 时 间 框 架 的 唯一 资料 。 


5.2 系统 树 


地 球 上 的 一 切 生命 形式 ,不 管 是 现存 的 还 是 已 经 灭绝 了 的 ,都 有 一 个 共同 的 起 源 , 它 们 的 祖先 可 
以 追溯 到 大 约 在 40 亿 年 以 前 生存 的 一 种 或 几 种 生物 。 因 此 ,所 有 动物 植物、 细菌 通过 祖 藉 而 相互 关 
联 。 亲 缘 关 系 近 的 生物 是 由 一 个 较 近 代 的 共同 祖先 传 下 来 的 ,亲缘 关系 远 的 生物 则 由 较 远 古 的 共同 祖 
先 传 下 来。 系统 发 育 研究 的 目的 是 :(1) 建 立 各 生物 间 正 确 的 系谱 学 联系 ,和 (2) 估 计 各 生物 自 它们 从 
最 后 一 个 共同 祖先 那里 分 岐 以 来 的 分 岐 的 时 间 。 

在 系统 发 育 研究 中 ,一 组 生物 类 群 间 的 进化 关系 常用 系统 树 (phylogenetic tree) 来 图 示 说 明 。 系 统 
树 是 一 种 由 节点 和 分 枝 组 成 的 图 象 , 其 中 任何 两 个 邻近 的 节点 都 只 由 一 个 分 枝 来 联结 (图 5 一 1)。 节 

s。 00。 


点 (nodes) 代 表 分 类 学 单位 ,而 分 枝 (branches) 则 用 祖 类 和 祖先 来 定义 这 些 单位 间 的 关系 。 一 个 树 的 分 
枝 模式 被 称 为 拓扑 图 (topology) 。 枝 长 (branch length) 通常 代表 在 该 分 枝 中 曾 发 生 过 的 变化 数 。 由 节 
点 表示 的 分 类 学 单位 可 以 是 物种 、 群 体 . 个 体 或 基因 。 

在 处 理 系统 树 时 ,我们 要 分 清 外 节点 (external nodes) 和 内 节点 (internal nodes)。 例 如 ,图 5 一 1a 
中 ,节点 ABC、D 和 匡 是 外 节点 ,其 余 的 都 是 内 节点 。 外 节点 代表 处 于 比较 中 的 现存 分 类 学 单位 ,并 
被 命名 为 操作 中 的 分 类 学 单位 (operational taxonomic units) 即 OTU 。 内 节点 则 代表 祖先 单位 。 

图 5 一 1 为 处 理 一 个 系统 树 的 两 种 普通 方法 的 示意 图 。 在 图 5 一 la 中 ,其 分 枝 是 无 尺度 的 (un- 


时 间 1 单位 


图 5 一 1 一 个 关于 5 个 OTU 的 系统 树 的 两 种 可 供 采用 的 表示 法 。(a) 无 尺度 的 分 枝 :现存 的 OTU 排 成 一 条 线 , 节 
点 位 于 与 分 岐 时 间 成 比例 的 地 方 。(b) 有 尺度 的 分 枝 :分 枝 的 长 度 与 分 子 变 化 数 成 比例 。 
scaled) ,它们 的 长 度 与 已 注 明 在 分 枝 上 的 变化 数 不 成 比例 。 这 种 表示 法 使 我 们 能 将 现存 的 OTU 排 成 
一 条 直线 ,而且 在 分 岐 时 间 已 知 或 已 估 出 时 ,还 可 把 代表 分 岐 事件 的 节点 按时 间 尺 度 来 排列 。 在 图 5 
一 lb 中 ,分 岐 是 有 尺度 的 (scaled), 且 其 长 度 正 比 于 变化 数 。 
如 果 任 何 两 个 OTU 间 的 距离 等 于 将 它们 联 起 来 的 所 有 分 枝 的 长 度 之 和 , 则 这 样 的 树 即 被 称 为 
是 加 性 的 (additive) 。 例 如 , 若 可 加 性 成 立 , 则 图 5 一 la 中 OTUA AIC 间 的 距离 应 等 于 2 十 1 十 3 十 2 王 
8。 两 个 OTU 间 的 距离 可 直接 从 分 子 数 据 ( 例 如 DNA 顺序 ) 算 出 ,而 枝 长 则 可 按 某 些 规 则 从 OTU 间 
距离 估 出 ( 见 第 77 页 )。 如 果 在 任 一 核 苷 酸 位 点 上 曾 发 生 过 多 重 替 换 , 则 可 加 性 一 般 不 成 立 ( 图 3 一 
cy 
若 一 个 节点 只 有 两 个 直接 的 后 代 谱系 , 则 它 是 两 分 又 的 (bifurcating), 若 它 有 两 个 以 上 的 直接 后 
代 谱 系 则 是 多 分 又 的 (multifurcating)。 为 简便 起 见 ,我 们 将 只 考虑 象 图 5 一 1 中 那样 的 两 分 又 树 。 


有 根 树 和 无 根 树 


系统 树 可 以 是 有 根 的 (rooted) 也 可 以 是 无 根 的 (unrooted) (图 5 一 2)。 在 有 根 树 中 ,存在 一 个 被 称 
为 根 ( 图 5 一 2a 中 的 R) 的 特殊 节点 ,由 此 导向 任何 别 的 节点 都 具有 唯一 途径 .每 一 途径 中 的 方向 与 进 
化 时 间 相 对 应 ,而 根 则 是 所 有 正 被 研究 的 OTU 5 OTU 间 的 关系 具 
体 化 而 未 定义 进化 途径 的 树 ( 图 5 一 2b) 。 

对 3 个 物种 来 说 ,存在 着 3 种 可 能 的 有 根 树 , 但 只 有 一 种 无 根 树 (图 5 一 3). 对 n 个 OTU 而 言 , 两 
分 叉 有 根 树 的 数目 (Ng) 由 : 
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注意 ,n 个 OTU 的 可 能 无 根 树 数 等 于 Cn 一 1 个 OTU 的 可 能 有 根 树 数 .OTU 从 2 到 10 的 可 能 有 根 树 
“0l，。 
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图 5 一 2 (a) 有 根系 统 树 和 无 根系 统 树 ”箭头 指示 从 根 (R) 到 OTUD) 的 唯一 途径 
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图 5 一 3 从 3 种 OTU 可 能 会 构建 出 3 种 不 同 的 有 根 树 (a), 但 却 只 有 一 种 无 根 树 (b) 。 
和 无 根 树 的 数目 列 于 表 5 一 1。 我 们 看 到 , 随 着 n 的 增加 Nu ANe 都 极 快 地 增 大 ,而 到 10OUT 时 已 经 
有 200 多 万 两 分 叉 无 根 树 和 将 近 3500 万 有 根 树 了 。 由 于 这 些 树 中 只 有 一 种 能 正确 地 表示 这 些 OIU 
间 真 实 的 进化 关系 ,所 以 , 当 n 较 大 时 ,推论 出 真实 的 系统 树 通常 是 非常 困难 的 。 
表 5 一 1 对 1 一 10 OTU 可 能 的 有 根 树 和 无 根 树 的 数目 


OTU 数 有 根 树 数 无 根 树 数 
2 1 1 
3 3 1 
4 15 3 
5 105 15 
6 954 105 
7 10395 954 
8 135135 10395 
9 2027025 135135 
10 34459425 2027025 


自 Felsenstein(1987) 
真实 树 和 推测 树 


导致 任何 类 群 的 OTU 形成 的 物种 形成 事件 的 秩序 ,在 历史 上 是 唯一 的 。 所 以 ,在 用 某 一 给 定数 
的 OTU 建立 的 所 有 可 能 的 树 中 ,只 有 一 种 能 代表 真实 的 进化 历史 。 这 样 一 种 系统 树 称 为 真实 树 (true 
tree)。 用 某 一 组 数据 和 某 种 构 树 法 得 到 的 树 称 推 测 树 (inferred tree), 推测 树 可 能 与 真实 树 等 同 ,也 可 
能 与 真实 树 不 同 。 


基因 树 和 物种 树 


表示 一 和 群 物种 的 进化 途径 的 系统 树 称 物种 树 (species tree)。 若 系统 树 是 根据 来 自 各 物种 的 一 个 
。62 。 


基因 构成 的 , 则 该 推测 树 即 为 基因 树 (gene tree)(Nei,1987) 。 它 与 物种 树 有 两 个 方面 不 同 。 第 一 ,从 两 
不 同 物 种 取样 的 两 基因 的 分 岐 可 能 在 时 间 上 早 于 两 物种 的 分 岐 (图 5 一 4) ， 这 将 造成 高 估 了 枝 长 的 结 
果 , 但 如 果 我 们 处 理 的 是 长 期 进化 ,在 这 个 过 程 中 由 物种 内 遗传 多 态 性 造成 的 分 岐 成 分 可 以 忽略 的 
话 , 则 还 不 至 于 出 现 严重 问题 . 
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图 5 一 4 本 图 表示 : 若 群 体 在 时 刻 卫 是 着 传 上 多 态 的 , 则 基因 分 化 (4 ) 通 常 比 群 体 分 化 (D) 出 现 得 早 。 结 果 形 成 用 a 
一 上 表示 的 6 个 等 位 基因 的 基因 进化 史 用 实 线 表示 ,群体 分 岐 则 以 虚线 表示 。 自 Nei(1987) 。 

基因 树 的 第 2 个 问题 是 ,基因 树 的 分 枝 模式 ( 即 它 的 拓扑 图 ) 可 能 与 物种 树 的 不 同 。 图 5 一 5 展示 

了 这 两 种 树 间 的 3 种 不 同 的 可 能 关系 。 基因 树 (a) 与 (b) 的 拓扑 图 和 与 其 对 应 的 物种 树 的 图 等 同 ( 例 
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im S-5 ty Abt 46 WY ) fo JK tC) TL 3 种 可 能 关系 。 在 (a) 和 (b) 中 ,物种 树 的 拓扑 图 与 基因 树 的 等 同 。 注 
意 ,(a) 中 基因 的 分 岐 时 间 大 致 等 于 群体 的 分 岐 时 间 。 而 (b) 中 却 不 然 ,基因 X 和 立 的 分 岐 时 间 大 大 早 于 各 自 所 属 的 
群体 的 分 岐 时 间 。 在 (c) 中 ,基因 树 的 拓扑 图 与 物种 树 的 不 同 。 对 于 中 性 等 位 基因 ,每 种 树 出 现 的 概率 已 在 该 树 的 下 
面 列 出 .ti 是 第 一 次 物种 形成 事件 发 生 的 时 间 ,t; 是 第 三 次 物种 形成 事件 发 生 的 时 间 。 图 中 工 =ti 一 tb,Ne WEAK 
群体 大 小 。 自 Nei(1987) 。 

如 ,X 和 YY 形成 一 簇 )。 然 而 基因 树 (c) 却 与 真实 的 物种 树 不 同 , 因 为 此 时 立 和 2Z 是 姐妹 类 群 . 当 第 一 
次 物种 分 化 和 第 二 次 物种 分 化 间 的 时 间 间 隔 (ti 一 tz) 较 短 时 ,得 到 错误 的 树 (c) 的 概率 将 是 相当 高 的 ， 
这 种 情况 在 确定 人 、 黑 猩猩 和 大 猩猩 间 的 系统 发 育 关 系 时 可 能 确实 存在 。 为 了 避免 得 到 这 种 错误 类 
型 ,在 构建 系统 树 时 就 必须 用 许多 基因 。 为 了 避免 随机 误差 也 需要 大 量 数据 。 因 为 核 苷 酸 蔡 换 是 随机 
地 发 生 的 ,所 以 有 可 能 会 产生 随机 误差 。 例 如 图 5 一 5a 中 ,谱系 Z 累积 的 替换 可 能 会 因 机 遇 而 比 谱系 
X 和 Y 的 少 ,尽管 它 发 生 分 枝 的 时 间 要 更 早 一 些 。 


5.3 系统 树 的 构建 方法 


文献 中 已 有 许多 构 树 方法 被 提出 来 。 有 关 的 详细 处 理 读 者 可 参考 史 尼 斯 和 索 卡 尔 (Sneath 和 
Sokal,1970) 、 根 井 (Nei,1987) 以 及 费 尔 森 施 泰 因 (Felsenstein ,1988) 等 的 论述 。 这 里 我 们 讲 4 种 在 系 
统 发 育 研究 中 常 被 用 到 的 方法 。 为 简单 起 见 , 我 们 考虑 核 苷 酸 顺序 数据 ,但 所 讲 到 的 方法 同样 也 可 用 
于 其 他 类 型 的 分 子 数 据 , 象 氨基 酸 顺 序数 据 。 

以 下 所 讲 的 方法 可 分 成 两 种 类 型 :距离 矩阵 法 (distance matrix methods) 和 最 节省 法 ( maxmum 
parsimony methods) 。 在 距离 矩阵 法 中 ， 进化 距离 (通常 为 分 开 两 分 类 学 单位 的 核 苷 酸 或 氨基 酸 蔡 换 
数 ) 按 所 有 可 能 的 分 类 单位 对 算出 ， 并 用 根据 距离 值 间 的 某 些 函 数 关 系 建立 的 算法 来 构建 系统 树 。 在 
最 节省 法 中 ,应 用 了 特性 状态 (例如 , 某 一 个 位 点 上 的 核 苷 酸 或 氮 基 酸 )， 而 导致 这 些 特性 状态 的 最 短 
途径 即 被 选取 为 系统 树 。 


不 加 权 算 术 平 均 组 对 法 (UPCMA) 


不 加 权 算 术 平 均 组 对 法 (unweighted pair group method with arithmetic mean)(UPGMA) 是 一 种 
简单 的 构 树 法 。 它 最 初 本 用 来 构建 分 类 学 表 型 关系 图 , 即 能 反映 出 各 OTU 间 的 表 型 相似 性 的 树 
(Sokal 和 Michener,1958; 并 见 第 68 页 ) ,但 如 果 进 化 速率 在 不 同 谱系 间 近 似 地 恒定 ,以 至 进化 距离 与 
分 岐 时 间 之 间 存 在 近似 的 线性 关系 , 则 它 也 可 用 来 构建 系统 树 (Nei,1975 ) 。 MRS 
核 苷 酸 ( 或 氨基 酸 ) 替 换 数 这 样 的 线性 距离 太 度 就 应 该 被 用 到 了 。 

UPGMA 法 采用 连续 聚 类 算法 ,在 此 法 中 局 部 拓扑 关系 按 相 似 性 的 级 别 来 鉴别 ， rr ae 
是 分 步 实 现 的 。 也 就 是 说 ,我 们 首先 从 所 有 OTU 中 找 出 两 个 最 相似 的 OTU ,并 把 它们 看 成 一 个 新 
OTU。 这 样 的 OTU 我 们 称 之 为 复合 OTU (composite OTU)。 接 着 ,从 这 种 新 的 OTU 群 中 我 们 再 找 
出 有 最 大 相似 性 的 对 子 , 如 此 继续 下 去 ,直到 我 们 最 后 仅 留 下 2 个 OTU 时 为 止 。 

为 了 对 此 法 作出 具体 说 明 ,让 我 们 来 考虑 一 个 包含 4 个 OTU 的 例子 。 成 对 的 进化 距离 ， A A Fe 
i AIK FE (Jukes 和 Cantor,1969) 所 估计 的 那样 (第 三 章 ) ,由 以 下 矩阵 所 给 出 : 


OTU 
OTU A B C 
B dap a 
C dac dac 
D dap dpp dep 


He EHP yA Be OTUi 和 j 间 的 距离 。 最 先 被 聚 类 的 两 个 OTU 是 距离 最 短 的 那 两 个 。 我 们 假定 
dAs 有 最 小 值 , 则 OTUA 和 是 最 先 被 聚 类 的 ,而 分 枝 点 则 放 在 距离 为 dan /2 替换 的 地 方 ( 图 5 一 6a) 。 


(a) A 


B (c) A 
3 B 
diapyc 
2 
C 
D 
d(ABC)D 
B5—6 444 0TU 校 UPGMA 法 分 步 构 建 系统 树 的 示意 图 ( 详 见 正文 ) 


第 一 次 聚 类 后 ,A 和 了 B 被 看 成 一 个 复合 OTU , 据 此 而 算出 一 个 新 距离 矩阵 ， 
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OTU 


OTU (AB) 人 
全 deAB)c 
D d(apyp dep 


FE WH 58 BEB pd capyc= (dac tdac)/2sdcasyp= (dAp 十 dap)/2。 换 言 之 ,一 个 单 OTU 和 一 个 复合 OTU 间 的 
ee. KM OTU 与 该 复合 OTU 的 各 组 成 单 OTU 间距 离 的 平均 值 。 如 果 dcAsyxc 是 新 矩阵 中 的 最 小 
距离 ,那么 ,OTU C 将 加 入 到 复合 OTU(CAB) 中 , 且 在 diapye/2 处 有 一 个 分 枝 节点 (图 5 一 6b) 。 

最 后 一 步 是 将 最 后 剩 下 的 OTUD 与 复合 OTU(CABC) 聚 类 。 整 个 树 的 根 位 于 dluAscp/2 王 [CdAb 十 
dsp 十 dco)/3]/2 处 。 用 UPGMA 法 推测 出 的 最 后 树 如 图 5 一 6c 所 示 。 

在 UPGMA 法 中 ,两 个 复合 OTU 间 的 距离 用 每 一 复合 OTU 中 的 所 有 组 成 OTU 间距 离 的 算术 
平均 算出 。 例 如 ,复合 OTU Gj) 和 复合 OTU(Cmn) 间 的 距离 为 : 
(dint + din + dim + din) 


dijon) = 4 Roxana) 
#2 & OTU Gjk) Al (mn) HIF PBA: 
doy t Gakic Gn di, + a. d . 
d Giit)Gmn) = fet ie he he te Ee) (5. 4) 


变形 距离 法 


。 如果 假定 速率 恒定 在 各 谱系 间 不 成 立 , 则 UPGMA 法 可 能 会 给 出 错误 的 拓扑 图 。 例 如 ,假定 图 5 
.= 一半 中 的 系统 树 是 真实 树 ,而 各 OTU 对 的 进化 距离 则 由 以 下 矩阵 给 出 : 


OTU 
OTU A B C 
B 8 
Cc 7 9 
D 12 14 11 


用 UPGMA 法 ,我 们 得 到 的 推测 树 在 分 枝 模式 上 与 真实 树 不 同 ( 图 5 一 7b)。 如 ,推测 树 中 OTUA AIC 
被 组 合 在 一 起 了 ,而 在 真实 树 中 ,A 和 B 才 是 姐妹 OTU 。( 注 意 , 此 例 中 可 加 性 不 存在 。 如 ,A 和 了 B 间 
的 真实 距离 为 8. 而 估 出 的 联结 A 和 B 的 分 枝 . 其 枝 长 之 和 为 3.50 十 0.75 十 4.25 一 8. 50) 。 

(a) 


5-7 (a) RK A RES Cb) IR AR. HER A ARR AL EY — AR REO AREA UPGMA 
方法 构造 。(c) 此 树 由 变形 距离 法 推断 得 到 。 根 必须 在 OTUD 和 OTUA、B 与 C 的 共同 祖先 节点 之 间 ，, 但 准确 的 位 
点 不 能 确定 。 

不 过 ,该 配 扑 图 错误 也 许 能 用 被 称 为 变形 距离 法 (transformed distance method ) 的 校正 方法 来 订 
IE (Farris, 1977 ;Klotz 等 ,1979) 。 简单 地 说 ,此 法 是 用 一 个 组 外 单位 (outgroup) 作 参 照 物 ,来 对 被 研究 
谱系 间 进 化 速率 不 等 的 情况 作 一 些 校正 ,然后 对 新 得 到 的 距离 矩阵 应 用 UPGMA 法 ,从 而 推测 出 该 
树 的 拓扑 图 .组 外 单位 是 一 个 我 们 对 其 有 外 在 认识 的 OTU .这 些 外 在 认识 ,如 分 类 学 的 或 古生物 学 的 
知识 ,能 清楚 地 表明 ,该 OTU 已 先 于 所 有 其 他 被 研究 的 OTU 而 从 其 共同 祖先 分 岐 出 来 。 


在 现在 的 例子 中 ,我 们 假定 分 类 单位 D 对 所 有 别 的 分 类 单位 来 说 是 一 个 组 外 单位 。 那 么 D 即 可 


当 作 参照 物 ,并 用 下 式 来 变换 距离 
< sani! IT (5.5) 


‘J 


Cd! f AB IE PE BS i= AB B& Cydp=(dantdantden)/3. dr S| AZEW T RIED Ad’ BY 1 AB 2 
正 的 。 做 此 手续 是 因为 ,实际 上 上 距离 不 可 能 是 负 的 。 对 于 有 n 个 OTU( 不 包括 组 外 单位 ) 的 一 般 情 形 ， 
2 


在 我 们 的 例子 里 , 瑟 一 交 而 新 距离 抢 阵 中 关于 分 类 单位 A.B 和 C 的 值 为 


OTU 
OTU A B 
B 10/3 
C 13/3 13/3 


Hd As 有 最 小 值 ,所 以 A AB 最 先 被 聚 类 在 一 起 ,然后 ,C 再 加 和 到 该 树 中 。 根据 定义 ,组 外 单位 O- 
TUD 决定 该 树 的 根 , 因 而 最 后 加 入 该 树 。 这 样 就 给 出 了 正确 的 拓扑 图 (图 5 一 7c)。 在 上 例 中 ,我 们 仅 
考虑 了 3 个 分 类 单位 和 1 个 组 外 单位 ,但 此 法 可 很 容易 地 推广 到 更 多 分 类 单位 和 /或 更 多 组 外 单位 的 
场合 。 

在 许多 具体 情况 下 ,不 可 能 预先 决定 被 研究 的 分 类 单位 中 哪 一 个 是 组 外 单位 。 为 了 克服 这 一 困 
难 , 两 步 进行 法 已 被 提 了 出 来 (Li,1981)。 第 一 步 ,用 UPGMA 法 先 推出 该 树 的 根 。 然 后 ,处 于 根 一 侧 
的 分 类 单位 被 当 作 参 照 物 (组 外 单位 ), 对 处 于 根 的 另 一 侧 的 谱系 间 不 相等 的 进化 速率 做 校正 ,以 后 再 
做 相反 方向 的 校正 。 在 我 们 的 例子 中 ,此 法 也 能 找 出 正确 的 树 。 


近邻 关系 法 


在 一 个 无 根 两 分 又 树 中 ,如 果 两 个 OTU 通过 一 个 内 部 节点 联结 , 则 它们 就 被 说 成 是 近邻 Cneigh- 
bors)。 例 如 ,图 5 一 8a 中 ,A 和 也 是 近邻 ,C 和 D 也 是 如 此 。 与 之 相 比 , 图 5 一 8b 中 ,A 和 C 不 是 近邻 ， 
BAC 也 不 是 。 然 而 ,如 果 我 们 把 OTUA 和 也 结合 成 一 个 复合 OTU , 则 复合 OTU(CAB) 和 单 OTUC 
就 变 成 了 一 对 新 近邻 。 

现在 我 们 假定 ,图 5 一 8a 中 展示 的 树 是 真实 树 。 那 么 , 若 可 加 性 存在 则 我 们 应 有 


dac + dgp = dan + de =a+b+e+d + 24 = dag + dcp + 2x - AB G2 
这 里 x 是 内 部 分 枝 的 长 度 。 因 此 ,以 下 两 个 条 件 成 立 : 
daz + dcp < dac + agp (5, 7a) 
和 
dap + dcp < dan + dac (5. 75) 


这 两 个 条 件 总 称 为 四 点 条 件 (four-point condition) 。 即 使 可 加 性 只 不 过 近似 地 存在 ,这 些 条 件 可 能 也 
是 成 立 的 。 

反之 ,对 系统 发 育 关 系 不 知 的 4 个 OTU 而 言 ,以 上 两 个 条 件 可 用 来 找 出 近邻 (A 和 B;C MD). 
一 旦 这 两 对 近邻 被 确定 ,系统 树 的 拓扑 图 也 就 被 确定 了 。 

萨 塔 斯 和 特 韦 尔 斯 基 (Sattath 和 Tversky,1977) 提出 以 下 方法 来 处 理 多 于 4 个 OTU 的 情况 。 首 
先 , 象 在 UPEGMA 中 的 情况 一 样 算出 距离 矩阵 。 对 每 种 可 能 的 四 单位 组 ,比如 OTUi,j,m Ain, WH di 
十 dadn 十 dn 和 do 二 dm。 假定 第 一 个 和 的 值 最 小 ,那么 ,我 们 把 1 和 j 对 以 及 m 和 mn 对 都 记 1 分 ,而 i 
和 本 对 和 mn 对 .和 m 对 ,j 和 mn 对 则 都 记 0 分 否则, 如果 dm 十 ds 有 最 小 值 , 则 我 们 就 给 1 和 曾 对 
以 及 j 和 mm 对 记 1 分 ,而 给 其 他 4 种 可 能 的 对 子 记 0 分 。 在 对 所 有 可 能 的 四 单位 组 都 评 过 分 以 后 ,得 
总 分 最 高 的 对 子 即 被 选 为 第 一 个 近邻 对 ,并 把 它 当成 一 个 OTU 来 处 理 , 下 一 步 ,如 在 UPGMA 中 的 
情况 一 样 算出 新 距离 矩阵 ,然后 重复 以 上 过 程 选 出 第 二 个 近邻 对 。 此 过 程 继 续 到 所 有 OTU 被 聚 类 时 
止 。 在 我 们 考虑 猿 和 人 的 系统 发 育 时 将 给 出 此 法 的 详细 说 朋 ( 见 第 72 页 )。 * 
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Cc 
图 5 一 8 (a) 有 4 个 OTU 和 (Cb) 有 5 个 OTU 的 两 分 又 无 根 树 。 


以 近邻 关系 概念 为 根据 的 另 一 种 方法 曾 由 菲 奇 (Fitch,1981) 提 出 。 塞 图 和 根 井 (Saitou 和 Nei, 
1987) 曾 提 出 一 个 称 为 近邻 结合 法 Cneighbor-joining method ) 的 方法 。 这 是 连续 地 找 出 使 树 的 总 长 度 
最 小 的 近邻 对 的 方法 。 


最 节省 法 


最 节省 或 最 少 进化 的 原则 涉及 : 找 出 一 个 要 求 最 小 进化 变化 数 的 树 ,以 解释 被 研究 OTU 间 观 察 
到 的 差异 ,这 样 一 种 树 称 为 最 节省 树 (maximum parsimony tree) 。 常 常 可 以 发 现 不 止 一 种 树 有 同样 的 
最 小 变化 数 , 所 以 ,推测 出 的 树 可 能 不 是 唯一 的 。 

下 面 讨论 的 方法 最 初 是 为 了 处 理 氨 基 酸 顺序 数据 而 提出 的 GEck 和 Dayhoft,1966), 后 来 经 修改 
fa RAT AH BI FF Bitch ,1977) 。 . 

我 们 先 对 信息 位 点 (informative sites) 进 行 定 义 。 一 个 核 苷 酸 位 点 是 具有 系统 发 育 方 面 的 信息 的 ， 


仅 当 它 在 众多 的 树 中 偏向 其 中 一 些 树 时 ,为 了 说 明 信 息 入 所 和 非 信息 位 点 问 的 区 别 ,让 我 们 考虑 以 下 
位 点 
顺序 2 
1 A Giese GS Oe: A 
2 Apna awe Ty G CG 
3 | es ee SR ae) Es ae Oa Om 
4 in the ae Diatiie woe Pere a, G 


对 4 个 OTU 有 3 种 可 能 的 无 根 树 ( 图 5 一 9)。 位 点 1 不 是 有 信息 的 ,因为 所 有 顺序 在 该 位 点 上 都 
有 A, 以 至 在 3 种 可 能 的 树 中 都 不 需要 任何 变化 。 在 位 点 2 上 ,顺序 1 有 A, 而 所 有 其 他 顺序 都 有 G， 
所 以 只 需 作 一 简单 假定 , 即 谱系 中 核 苷 酸 从 G 变 成 A 导 至 了 顺序 1。 于 是 ,这 一 位 点 也 不 是 有 信息 
的 ,因为 对 这 3 种 可 能 的 树 来 说 每 种 都 只 需要 1 次 变化 。 如 图 5 一 9a 所 示 , 对 位 点 3 来 说 ,这 3 种 可 能 
的 树 中 的 每 一 种 都 需要 2 次 变化 ,所 以 也 不 是 有 信息 的 。 注 意 , 如 果 假 定 图 5 一 9a 的 树 I 中 联结 OTU 
1 和 :2 的 节点 上 的 核 苷 酸 是 C( 或 A) 而 不 是 G, 则 该 树 所 需要 的 变化 数 仍 为 2。 图 5 一 9b 表明 对 于 位 
点 4 这 3 种 树 的 每 一 种 都 要 求 3 次 变化 ,所 以 位 点 4 也 是 非 信 息 的 。 对 于 位 点 5, 树 工 只 要 求 1 次 变 
化 ,而 树 工 和 开 则 各 要 求 2 次 变化 (图 5 一 9c) ,所 以 该 位 点 是 有 信息 的 。 

从 这 些 例子 中 我 们 看 到 ,就 我 们 所 谈 到 的 分 子 数 据 而 言 , 仅 当 一 个 位 点 上 至 少 有 两 种 不 同类 型 的 
核 苷 酸 、 每 种 类 型 至 少 在 两 个 被 研究 顺序 中 出 现时 ,该 位 点 才 是 有 信息 的 .在 上 例 中 ,信息 位 点 用 星 号 
C* ) 指 出 。 

为 了 推出 一 个 最 节省 树 ,我 们 首先 要 找 出 所 有 信息 位 点 。 接 着 ,对 每 种 可 能 的 树 我 们 算出 每 一 信 
息 位 点 上 的 最 小 替换 数 。 在 上 例 中 ,对 于 位 点 5.7 和 9, 树 I 分 别 需要 1.、1 和 2 次 变化 , 树 工 分别 需要 
2.2 和 1 次 变化 , 树 开 分 别 需要 2.2 和 2 次 变化 。 最 后 一 个 步 聚 是 ,对 每 种 树 将 所 有 信息 位 点 上 的 变 
化 数 加 和 ,并 选 出 总 替换 数 最 小 的 那 种 树 。 在 我 们 的 例子 中 ,因为 树 I 在 信息 位 点 上 需要 的 变化 数 最 
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图 5 一 9 关于 4 个 DNA 顺序 (1.2,3 和 4) 的 3 种 可 能 的 无 根 树 (I，IL 和 下 ) 这 4 个 顺序 曾 被 用 来 选取 最 节省 树 册 
(REX) 。 终端 节点 处 指出 了 现存 物种 中 该 同 源 位 置 上 的 核 音 酸 种 类 。 分 枝 上 的 每 一 个 国 点 表示 一 次 替换 , 它 被 放 
在 发 生 替 换 欧 分 村 上 。 注 意 , 每 种 树 的 两 个 内 部 节点 上 的 核 苦 酸 只 表示 了 几 种 可 供 选 择 的 构建 中 的 一 种 。 例 如 , 树 - 
IE (c) 的 两 个 内 部 节点 上 可 能 都 是 G 而 不 是 A( 右 下 角 )。 在 这 种 情况 下 ,两 次 着 换 将 位 于 章 致 物种 3 和 4 的 分 枝 
上 。 而 所 要 求 的 替换 最 小 数 却 保持 相同 。 
小 (4), 所 以 选中 树 I 
在 有 4 个 OTU 的 情况 下 ,一 个 信息 位 点 只 偏向 3 种 可 供 选取 的 树 中 的 一 种 .例如 ,位 点 5 偏向 树 
I 甚 过 树 工 和 树 开 ,因而 被 说 成 是 支持 树 工 的 。 容 易 看 出 ,受信 息 位 点 支持 数 最 大 的 那 种 树 就 是 最 节 
省 树 。 例 如 ,上 例 中 , 树 工 受 2 个 位 点 支持 , 树 工 受 1 个 位 点 支持 ,而 树 正 无 位 点 支持 ,结论 不 言 自 明 。 


5.4 表 型 学 与 进化 枝 学 


分 类 学 中 长 期 存在 的 争论 就 是 那些 一 直 在 “进化 枝 学 家 ”和 ”“ 表 型 学 家 ” 间 发 生 的 言辞 刻薄 的 争 
论 。 进 化 枝 学 (cladistics) 这 个 词 可 以 定义 为 研究 进化 途径 的 科学 。 换 句 话说 ,进化 枝 学 家 对 这 样 一 些 
问题 感 兴趣 :在 一 群生 物 中 存在 多 少 分 枝 ? 哪些 分 枝 与 别 的 哪些 分 枝 相 联 ? 分 枝 次 序 如 何 (Sneath 和 
Sokal,1973)? 一 种 表示 这 种 祖先 一 后 代 关 系 的 树 状 网 络 称 进化 分 枝 图 (cladogram) 。 换 柯 话 说 ， spss 
枝 图 即 指 一 种 有 根系 统 树 的 拓扑 图 。 

另 一 方面 , 表 型 学 (phenetics) 是 根据 一 群生 物 间 的 相似 程度 来 研究 它们 间 的 关系 的 科学 , 引 以 为 
据 的 类 似 性 可 以 是 分 子 上 的 、 表 型 上 的 或 解剖 学 上 的 。 表 示 表 型 学 关系 的 树 状 网 络 称 表 型 关系 图 
(Phenogram)。 虽 然 表 型 关系 图 可 以 当 作 进化 枝 学 关系 的 指示 物 来 用 ,但 它 可 不 必 与 进化 分 枝 图 等 
同 。 如 果 在 分 岐 时 间 和 遗传 学 上 的 (或 形态 学 上 的 ) 分 岐 程度 间 存 在 线性 关系 , 则 这 两 种 树 可 能 会 变 得 
相互 等 同 。 

在 上 面 所 讨论 的 方法 中 ,最 节省 法 是 进化 枝 学 方法 的 一 个 典型 代表 ,而 UPGMA 法 则 是 二 种 典 
型 的 表 型 学 方法 。 然而 ,其 他 方法 却 不 能 按 以 上 标准 简单 地 进行 分 类 。 例 如 ,变形 距离 法 和 近邻 关系 
法 常常 被 说 成 是 表 型 学 方法 ,但 这 是 一 种 不 确切 的 说 法 。 虽 然 这 些 方法 用 了 类 似 性 (或 不 似 性 引 臣 
离 ) 太 度 , 但 它们 并 没有 假定 类 似 性 和 进化 关系 间 直接 关联 ,也 并 不 打算 推测 表 型 学 关系 ， 

在 分 子 系统 发 育 中 , 用 更 合理 一 些 的 分 类 方法 应 把 它们 分 成 距离 法 和 特性 状态 法 (distance and 
character-state approaches) . 属于 前 者 的 方法 根据 距离 尺度 , 象 核 苷 酸 或 氨基 酸 的 替换 数 等 ,而 后 者 则 ; 
依靠 该 特性 的 状态 ,如 某 一 特定 位 点 上 的 核 昔 酸 或 氨基 酸 ,或 某 - DNA 位 置 上 缺失 或 插入 的 出 现 或 
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不 出 现 等 。 根 据 这 种 分 类 , 则 UPGMA 法 ,变形 距离 法 和 近邻 关系 法 都 是 距离 法 ,而 最 节省 法 则 是 一 

一 直 有 这 样 一 种 说 法 , 即 ,特性 状态 法 比 距 离 法 更 有 效用 ,因为 该 原始 资料 是 一 串 特性 状态 (例如 
核 苷 酸 顺 序 ), 而 将 特性 状态 数据 转变 成 距离 矩阵 以 后 ,有 些 信息 就 丢失 了 。 然 而 我 们 注意 到 ,虽然 最 
节省 法 事实 上 应 用 的 是 原始 资料 ,但 通常 它 仅 用 了 可 用 资料 的 一 小 部 分 。 例 如 ,第 75 页 上 的 例子 中 ， 
只 有 3 个 位 点 被 用 于 分 析 中 , 倒 有 6 个 位 点 被 排除 在 外 了 。 为 此 ,此 法 常 比 有 些 距 离 矩阵 法 的 效率 低 
(fal Gn KL Saitou 和 Nei,1986)。 当 然 , 如 果 信 息 位 点 数 多 , 则 最 节省 法 一 般 是 非常 有 效 的 。 

最 后 ,应 该 注意 到 ,不 管用 何 种 方法 ,一 个 推测 树 常 难免 有 拓扑 图 错误 。 为 了 得 到 正确 的 树 ,通常 
需要 大 量 数据 资料 。 


5.5 枝 长 的 估计 


除了 在 UPGMA 法 中 外 ,我 们 都 不 曾 讨论 过 怎样 去 估计 梳 长 的 问题 。 现 在 ,我们 在 该 树 的 拓扑 图 
已 被 推测 出 来 的 假定 下 ,来 处 理 这 一 问题 。 我 们 只 考虑 用 距离 矩阵 法 推测 出 来 的 树 对 于 最 节省 法 来 
说 ,这 个 问题 要 复杂 得 多 ( 见 Fitch,1971)。 下 面 讨 论 的 方法 是 菲 奇 和 马 戈 利 阿 什 (Fitch 和 Margoliash， 
1967) 的 方法 。 

首先 ,我 们 考虑 一 种 最 简单 的 情形 , 即 一 个 有 3 个 OTU(CA,B 和 C) 和 1 个 节点 的 无 根 树 ( 图 5 一 
10a)。 设 xy 和 2z 分 别 是 导向 A.B 和 CC 的 分 枝 的 长 度 。 很 容易 看 出 以 下 等 式 成 立 : 


za 一 工 十 y (5. 8a) 
dy = 2+2 (5. 8b) 


due = 9 +z (5. 8c) 


(b) 


at : 
图 5 一 10 AIA DRA MH (Fitch 和 Margoliash ,1967) 法 计算 枝 长 时 采用 的 无 根系 统 树 。(a) 有 3 个 OTU 的 
树 ,(b) 有 5 个 OTU 的 树 。 


从 这 些 等 式 ,我 们 得 到 以 下 解 : 


phe: fant duc — doe (5. 9a) 


ae dap + dpc — dac 
eet tt a0) 


z= dac + dpc — dap 

2 
我 们 现在 来 处 理 有 3 个 以 上 OTU 的 情形 .为 简单 计 ,我 们 假定 有 5 个 OTU(1,2,3,4 M5). mK 
拓扑 图 和 各 枝 长 如 图 5 一 10b 所 示 。 假 定 OTU 1 和 2 是 构 树 过 程 中 最 先 被 聚 类 的 OTU , 则 我 们 分 别 
用 A 和 Bi 来 表示 OTU1 和 2 而 把 所 有 别 的 OTU(3、4 和 5) 放 在 一 个 复合 OTU 中 ,并 表示 成 C。 通 过 
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(5. 96) 


(5. 9c) 


这 种 安排 ,我 们 可 以 用 等 式 5. 9a 一 5.9c 来 估计 导向 A.B 和 C 的 分 枝 的 长 度 . 不 过 ,现在 dac 一 de 一 
(dys tdyytdis)/3»drc=dorsis) = (des tdou+dos)/3 于 是 ,我 们 有 a=x Mb=y. 接着 OTUI M2 Ram 
_ 个 复合 OTU。 下面 再 假定 ,复合 OTU(12) 与 单 OTU3 是 下 一 个 要 结合 在 一 起 的 对 子 。 于 是 ,我 们 
分 别 把 复合 OTU(12) 和 单 OTU3 用 A 和 B 表 示 , 把 其 余 的 OTU( 即 4 和 5) 放 在 新 的 复合 OTUC 
中 。 以 上 述 同 样 的 方式 ,我 们 将 得 到 x,y 和 z。 注 意 ,这 时 d=y,c 十 (a 十 b)/2=x。 从 前 一 次 我 们 得 到 
的 关于 a 和 b 的 值 ,可 以 算出 c。 继 续 进 行 这 样 的 过 程 , 直 到 所 有 枝 长 都 得 到 时 为 止 。 

注意 ,有 时 某 一 被 估 出 的 枝 长 可 能 会 是 负 的 。 由 于 实际 枝 长 绝 不 可 能 是 负 的 ,所 以 ,最 好 用 0 来 代 
替 这 样 的 估 值 。 

作为 应 用 上 述 方 法 的 一 个 例子 ,让 我 们 来 算 一 下 图 5 一 7c 中 那个 树 的 各 枝 长 。 为 便于 说 明 ,我 们 
把 在 推测 该 树 的 拓扑 图 时 用 过 的 距离 矩阵 再 次 列 出 。 为 了 避免 与 等 式 5.9 中 的 符号 混淆 ,我 们 把 O- 
TUA,B,C 和 D 分 别 地 重新 命名 为 OTU1,2,3 和 4。 


OTU 
OTU 1 2 3 
2 8 
3 7 


因为 OTU1 和 2 最 先 被 聚 类 ,所 以 ,我 们 把 OTU3 和 4 放 在 一 个 复合 OTUC 中 ,从 而 先 算 出 导向 
OTU1 和 2 的 两 个 分 枝 的 长 度 (a 和 b)。 而 我 们 有 das=diz=8,dac= (di3tdy)/2=(74+12)/2=9. 5 
和 dac 一 (d: 十 dx)/2 王 11.5。 由 等 式 5. 9a 一 5. 9c ,我们 有 :a=—x= (84+ 9. 5—11. 5)/2=3,b=y=(8+ 
11. 5 一 9)/2=5。 下 一步 我 们 把 OTU1 和 2 处 理 成 OTU(12) 并 用 A Hm. FH, RNA :das=—day;:= 
(dis+do3)/2=(7+9)/2=8,dac=daz= (dis tda)/2= 124+14)/2=13,dsce=du=1l. AK RES 
sh 5. 9a 一 5. 9c, RITA :x= (8+13—11)/2=5,d=y=(8+11—13)/2=3,e=z= (134+11—8)/2=8. 
由 图 5 一 7c 可 以 看 出 (a 十 b)/2 十 cx, 所 以 ,c 王 1。 至 此 计算 完毕 。 然 而 请 注意 ,由 于 我 们 不 知道 根 的 
准确 位 置 , 所 以 我 们 不 能 估 出 联系 根 和 OTUD 的 分 枝 的 长 度 , 而 只 能 估 出 从 OTUA,B AC 的 共同 祖 
先 节点 通过 根 到 OTUD WK EE. Bl e=8. 


5.6 寻找 无 根 树 的 根 


大 多 数 构 树 法 得 到 的 都 是 无 根 树 。 为 了 找到 无 根 树 的 根 ,我们 通常 都 需要 一 个 组 外 单位 ( 即 一 个 
OTU ,其 外 在 信息 ,如 古生物 学 证 据 , 清 楚 地 表明 它 比 那些 被 研究 的 分 类 单位 更 早 地 发 生 分 枝 )。 而 根 
则 被 放 在 该 组 外 单位 和 将 它 和 别 的 OTU 联结 起 来 的 节点 之 间 。 
虽然 我 们 必须 能 肯定 该 组 外 单位 的 确 比 所 有 别 的 分 类 单位 更 旱地 发 生 分 岐 ,但 奉劝 各 位 ,不 要 选 
一 个 与 被 研究 的 各 分 类 单位 亲缘 关系 过 于 遥远 的 组 外 单位 ,因为 ,在 这 样 的 情况 下 很 难得 到 该 组 外 单 
位 与 其 他 分 类 单位 间 的 可 靠 估 值 。 例 如 ,在 构建 一 组 有 胎盘 哺乳 类 间 的 系统 发 育 关 系 时 ,我 们 可 以 用 


一 种 有 袋 类 作为 组 外 单位 。 仅 当 所 用 的 DNA 序列 在 进化 中 是 高 度 保守 的 时 , 鸟 类 才 可 能 被 当成 可 靠 


的 组 外 单位 。 在 此 例 中 植物 与 真菌 显然 也 够 资格 作为 组 外 单位 ,不 过 ,仅仅 因为 它们 与 哺乳 类 的 关系 
太 过 遥远 用 它们 作 组 外 单位 ,结果 就 可 能 会 出 现 严重 的 拓扑 图 错误 。 用 一 个 以 上 的 组 外 单位 (假若 它 
们 与 别 的 分 类 单位 都 不 是 关系 遥远 ) , 则 一 般 能 改善 该 树 拓扑 图 的 估计 结果 。 该 组 外 单位 还 必须 在 系 
统 发 育 上 与 别 的 OTU 不 至 于 太 接 近 , 因 为 ,在 这 种 情况 下 我 们 不 能 肯定 它 是 一 个 真正 的 组 外 单位 ， 
即 不 能 肯定 它 与 其 他 OTU 的 分 歧 早 于 这 些 OTU 相互 间 的 分 岐 。 

在 缺少 组 外 单位 的 情况 下 ,我 们 可 以 通过 假定 进化 速率 在 所 有 分 枝 上 近似 一 致 来 放置 根 。 在 这 种 
假定 下 ,我 们 把 根 放 在 两 个 OTU 间 的 最 长 路 组 的 中 点 处 ‘on Sill 
Se — 


5.7 物种 分 岐 时 间 的 估计 


因为 计生 物 学 记录 远 不 够 完全 ,所 以 我 们 常常 不 去 管 物种 分 岐 的 年 代 。DNA 顺序 数据 在 这 方面 
s。70 。 


可 能 会 给 出 很 大 帮助 。 从 以 前 的 研究 中 获知 我 们 假定 某 一 DNA 序列 的 进化 速率 ,为 每 年 每 位 点 r 替 
换 。 为 了 得 到 物种 A 和 也 间 的 分 岐 时 间 (T) ,我 们 对 来 自 这 两 个 物种 的 该 顺序 进行 比较 ,并 算出 每 位 
点 替换 数 (K)。 如 第 四 章 所 示 , 我 们 有 以 下 等 式 : 


K 
= oF (5.. 40) 


Att .T 估计 为 


K 
T=> (5.11) 


如 在 第 四 章 所 说 明 过 的 那样 ,从 一 组 生物 得 到 的 核 苷 酸 替 换 速率 也 许 不 能 用 于 另 一 组 生物 .为 了 
避免 出 现 这 样 的 问题 ,我 们 可 通过 加 进 第 3 个 物种 C( 它 与 物种 对 A 和 B 的 分 岐 时 间 已 知 ) ,来 估计 
替换 速率 (图 5 一 11)。 设 Kij 是 物种 1 和 j 间 每 位 点 核 苷 酸 替 换 数 ,那么 , 核 苷 酸 替 换 速 率 可 由 


fly Kac + Koc 
一 一 《5. 12) 
图 5 一 11 eit poked ia A ay A LEX) 
估 出 。 物 种 A FB ial Ay AI 4D ek et Me (TA: 
fie Kas _ 2K asl) (5. 13) 


2r — Kac + Kee 
fit, RZET. CMT, 未 知 的 情况 下 ,Ti 由 下 式 给 出 ; 
(Kac + Kyc)T, 
thas 

以 上 公式 均 假 定 速率 恒定 。 但 如 前 一 章 中 所 讨论 的 那样 ,此 假定 常常 是 不 成 立 的 ,所 以 估 出 的 分 
岐 时 间 应 该 小 心 处理 。 李 和 谷村 (Li 和 Tanimura,1987) 曾 提出 一 种 方法 ,此 法 能 降低 替换 速率 不 等 对 
分 岐 时 间 估 计 的 影响 。 

早先 我 们 已 经 注意 到 ,两 顺序 间 的 分 岐 时 间 可 能 比 携带 这 两 个 顺序 的 两 物种 间 的 分 岐 时 间 早 。 不 
过 ,如 果 我 们 关心 的 是 长 期 分 岐 事件 ,比如 说 几 百 万 年 或 更 长 的 时 间 等 级 , 则 这 种 误差 通 常 并 不 很 严 
重 。 还 应 该 注意 ,分 岐 时 间 的 估 值 通常 承受 着 较 大 的 随机 误差 。 为 了 减少 这 类 误差 ,在 估计 中 应 该 用 
许多 顺序 。 


T; (5. 14) 


5.8 进化 校 


系统 发 育 研究 的 目的 是 建立 不 同 物种 间 的 进化 关系 。 特 别 地 ,我 们 对 找 出 自然 进化 枝 (clades) 感 
兴趣 。 一 个 进化 枝 被 定 尽 成 一 组 有 共同 祖先 的 物种 ,而 该 祖先 却 不 为 这 一 进化 枝 外 的 其 他 物种 所 共 
有 。 

图 5 一 12 BMH AWN 3 个 网 ;总 纲 , 卜 行 网 和 哺乳 纲 间 的 进化 关系 。 我 们 看 到 ,经 典 分 类 学 把 
疏 行 类 指定 为 一 个 独立 的 网, 这 与 进化 枝 的 定义 不 符 , 因 为 这 3 类 疏 行 动物 与 另 一 个 类 群 一 一 鸟 类 有 
共同 祖先 ,而 后 者 则 并 不 被 包括 在 疏 行 岗 的 定义 范围 内 。 另 一 方面 , 鸟 类 与 甸 类 倒 的 的 确 确 地 构成 了 
一 个 自然 进化 枝 , 初 龙 亚 纲 , 因 为 它们 所 共有 的 一 个 共同 祖先 不 为 除 鸟 类 和 乌 类 以 外 的 任何 现存 生物 
所 共有 。 类 似 地 ,所 有 鸟 类 和 所 有 有 怜 行 类 合 在 一 起 构成 一 个 自然 进化 枝 。 
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图 5 一 12 鸟 类 ,爬行 类 和 哺乳 类 的 分 枝 进 化 图 。 有 爬行 类 不 构成 一 个 自然 进化 枝 , 因 为 它们 与 岛 类 有 共同 祖先 ,而 后 
者 并 不 被 包括 在 爬行 岗 中 。 另 一 方面 , 鸟 类 与 等 类 却 构成 一 个 自然 进化 枝 ( 初 龙 亚 岗 )， 因为 它们 所 共有 的 一 个 共同 
祖先 (黑色 方块 ) 不 为 任何 别 的 生物 所 共有 。 


5.9 人 和 猿 的 系统 发 育 


与 人 类 在 进化 上 最 接近 的 亲缘 关系 问题 一 直 是 令 生 物 学 家 们 感 兴趣 的 问题 。 例 如 ,达尔 文 (Dar- 
win,1871) 兽 认为 ,非洲 猿 ,黑猩猩 CPanz) 和 大 猩猩 (Gorzla) 是 人 类 的 近亲 ,所 以 他 的 结论 是 ,人 类 的 进 
化 起 源 将 被 发 现 一 定 是 在 非洲 。。 由 于 各 种 原因 达尔 文 的 观点 没有 引起 人 们 的 兴趣 , 且 在 一 个 相当 长 
的 时 期 里 ,分 类 学 家 们 认为 人 属 ( 五 omo) 是 唯一 与 猿 的 亲缘 关系 较 远 的 一 类 ,所 以 它 自 成 一 科 , 即 人 
科 。 黑 猩猩 ,大 猩猩 和 马 来 猩 猩 CPongo) 通 常 被 放 在 独立 的 一 个 科 , 即 猩猩 科 ( 图 5 一 13a) 中 。 长 臂 猿 
( 瓦 ylobates) 或 者 独立 成 科 或 者 被 分 在 猩猩 科 ( 图 5 一 13b; 见 Simpson ,1961) 。 古 德 曼 (Goodman,1963) 
曾 正 确 地 认识 到 ,这 种 系统 安排 是 以 人 类 为 中 心 的 ,因为 人 类 代表 着 “系统 发 育 所 达到 的 一 个 新 等 级 ， 
一 个 比 猿 和 所 有 别 的 以 前 存在 的 等 级 更 高 的 等 级 ”。 然 而 ,把 各 种 猿 放 在 一 个 科 里 而 把 人 放 在 另 一 个 
科 里 ,这 就 意味 着 这 些 猿 相互 间 共 有 一 个 比 人 更 近 的 共同 祖先 。 当 把 人 与 一 种 现存 的 猿 放 在 同一 进化 
枝 中 时 , 它 通常 是 与 亚洲 猿 , 即 马 来 猩 猩 放 在 一 起 (图 5 一 13c;Schultz,1963) 。 

由 于 血清 沉淀 法 的 应 用 , 古 德 最 (Goodman ,1962) 已 能 证 明 人 、 黑 猩猩 和 大 猩猩 构成 一 个 自然 进 
化 梳 ( 图 5 一 13d) ,而 马 来 猩 猩 和 长 臂 猿 与 别 的 猿 类 发 生 分 岐 的 年 代 则 要 早 得 多 。 根 据 微量 互补 结合 
资料 , 萨 里 奇 和 威尔逊 (Sarich 和 Wilson ,1967) 估 计 人 与 黑猩猩 或 大 猩猩 间 see Beatie 500 
万 年 前 ,而 不 是 当时 普遍 为 古生物 学 家 所 接受 的 至 少 1500 万 年 前 。 

然而 ,血清 学 方法 .电泳 法 以 及 氨基 酸 顺 序 等 都 不 能 解决 人 与 非洲 猿 间 的 进化 关系 问题 ,而 所 谓 
人 一 大 猩猩 一 黑猩猩 的 三 分 法 仍 未 得 到 解决 ,并 继续 是 一 个 极 有 争议 的 问题 (图 5 一 14)。 下 面 , 我 们 
将 用 M., 右 德 曼 及 其 同事 ( 见 Miyamoto 等 ,1987) 和 其 它 学 者 (Maeda 等 ,1988) 得 到 的 DNA 顺序 资 
料 * 以 表明 分 子 证 据 支 持 人 一 黑猩猩 进化 枝 , 同 时 对 前 几 节 所 讨论 的 构 树 法 加 以 解释 说 明 。 

表 5 一 2 展示 了 以 下 几 个 OTU 每 一 对 子 间 每 100 位 点 的 核 苷 酸 替 换 数 : 人 (H) ,黑猩猩 (C) KE 
猩 4《G) 马 来 猩猩 (9) 和 罗 猴 CR) .我们 先 对 这 些 距离 用 UPGMA 法 。 人 与 黑猩猩 间 的 距离 最 短 (dac== 
1.45 六 因此 ,我 们 首先 把 这 两 个 OTU 结合 ,并 把 节点 放 在 1. 45/2=0. 73 处 (图 5 一 15ay。 然 后 ,我 们 
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图 5 一 13 现代 猿 和 人 (人 总 科 ) 的 4 种 供 选 择 的 系统 发 育 和 分 类 方式 。 传 统 分 类 法 把 人 类 独立 出 来 ,如 (a) 和 (b) 中 
所 展示 的 那样 。 人 与 马 来 猩猩 的 聚 类 如 (c) 中 所 示 。 把 分 子 的 和 形态 学 的 证 据 结合 起 来 则 偏向 (d) 中 所 示 的 那 种 分 


类 方式 。 
(b) H c 1 C C 人 
. ‘i ey * : 本 


图 5 一 14 (〈a) 关 于 大 猩猩 .黑猩猩 和 人 的 3 种 可 能 的 有 根 树 。(b) 以 马 来 猩 猩 作为 组 外 单位 的 相应 无 根 树 。 物 种 缩 
写 :C, 黑 猩猩 CPan troglod ytes);H,A (Homo sapiens) ;G , K ¥% & (Gorilla gorzla);OD, 马 来 猩猩 CPomgo pygmaeus) 


算出 该 复合 OTU(HC ) 与 其 余 每 一 物种 间 的 距离 ,得 出 一 个 新 的 距离 矩阵 : 


OTU 
OTU (HC) G O 
G 1.54 
O 2.96 3.04 
R 7.53 Jao. Se a0 
因为 CHC) 和 G 为 最 短 的 距离 所 隔 开 ,所 以 它们 是 下 一 个 要 结合 起 来 的 对 象 , 且 该 联结 的 结 节 位 于 1. 


54/2=0.77 处 。 继 续 此 类 过 程 ,我 们 即 得 到 图 5 一 15a ri a AC 的 
分 枝 结 点 非常 接近 于 (HC) 和 G 的 分 枝 节点 。 事 实 上 ,这 两 个 节点 间 的 距离 , 比 了 C 和 G 间 所 有 关于 


(a) 上 ) 天 


图 5 一 15 由 UPGMA 法 (a) 以 及 萨 塔 特 和 斯 韦 尔 斯 基 的 近邻 关系 法 (b) 推 测 出 的 .关于 人 、 黑 猩猩 ,大 猩猩 和 罗 猴 
的 进化 树 。 
成 对 距离 估 值 的 标准 误差 都 小 ( 表 5 一 2)。 所 以 ,虽然 该 资料 表示 人 的 最 近 现 存 亲 属 是 黑猩猩 ,但 该 资 
料 并 没 对 分 枝 次 序 问 题 给 出 结论 性 的 解决 . 另 一 方面 , 马 来 猩 猩 对 于 人 一 黑猩猩 一 大 猩猩 进化 枝 而 言 
是 一 个 组 外 单位 ,这 一 点 则 是 毫 不 含糊 的 。 
®5—-2 各 OTU 间 每 100 位 点 核 苷 酸 蔡 换 数 的 平均 值 ( 对 角 线 下 ) 和 标准 误差 (对 角 线 上 》) 
OTU 
OTU 人 黑猩猩 KEE 马 来 狸 独 Bi 
0.18 0. 25 


A Li 4 (1987b) 


a. 所 用 顺序 资料 为 长 5. 3Kb 的 非 编 码 DNA, 它 由 两 个 分 开 的 区 域 构成 :(1) 由 Koop 等 (1986b) 报 导 的 人 站 珠 蛋 白 基 因 座 位 
(2. 2kb) 和 由 Maeda 等 (1983,1988) 定 序 的 长 3. 1kb 的 1 一 8 珠 蛋 白 基 因 间 区 域 。 


下 面 , 我 们 用 萨 塔 特 和 斯 韦 尔 斯 基 的 近邻 关系 法 。 我 们 一 次 考虑 4 个 OTU， 由 于 现 有 5 个 OTU， 
所 以 有 5! /C4! (S—4)10=5 种 可 能 的 四 单位 组 。 我 们 从 OTUH、C.G 和 O 开始 ,并 算出 以 下 距离 之 
和 (数据 自 表 5 一 2) :dac 十 dco=1. 45 十 3. 04=4. 49,ductdco=4. 45 和 duotdec=4.55. AW 2% 
和 最 小 ,所 以 我 们 选 HAG 为 一 个 近邻 对 ,C MO 为 另 一 对 ( 表 5 一 3)。 类 似 地 ,我们 再 考虑 另外 4 种 
可 能 的 四 单位 组 ,结果 如 表 5 一 3 所 示 。 从 表 5 一 3 的 最 后 一 行 我 们 看 到 ,其 在 所 有 近邻 对 中 (OR) 有 最 
高 的 近邻 关系 得 分 ,所 以 我 们 选取 (OR ) 为 第 一 个 近邻 对 。 把 这 个 对 子 当 作 一 个 OTU , 则 我 们 得 到 以 
下 新 的 距离 矩阵 : 
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OTU H C G 
C 1.45 
G 1.51 4.57 


(OR) 5.25 6 Be 6.99 
表 5 一 3 用 表 5 一 2 中 的 距离 矩阵 得 到 的 近邻 关系 得 分 
用 于 比较 的 OTU" 成 对 距离 之 和 选取 的 近邻 对 


dHc 十 dco 王 4. 49 
H,C,G,0O duc t+dco=4. 45 (HG) , (CO) 
duo+dcc = 4. 55 


dc 十 dcR 王 8. 84 
H,C.GsR duc +dcr= 9. 06 CHC), (GR) 
dur+dcc = 9. 08 ‘ 


duc +dor= 8. 55 
H,C,O,R duo+dcr=10. 53 CHC), (OR) 
dur+dco= 10. 45 


duc+dor=8. 61 
HeGsGsk: duo +der=10. 37 (HG) , (OR) 
dur+dco=10. 55 


dco +dor=8. 67 
C,G,0,R dco+der=10. 33 (CG), (OR) 
dcr+dcoo=11. 59 


(HC) =2, (HG) =2, (HO) =0, (HR) =0, (CG) =1 


总 分 
(CO) =1,(CR)=0, (GO) =0, (GR) =1, (OR) =3 


a.H,A;C, R#E GC, KEE;:0,5REE:R IR. 

HMB 4 + OTU. MURA D Gh . duc +decor) =6. 76<duc + decor) = 6. 76<ducory + dec = 
6.82, Ak RiNwH AC 作为 一 个 近邻 对 ,G 和 (COR ) 为 另 一 近邻 对 。 用 此 法 最 后 得 到 的 树 如 图 5 一 
15b 所 示 。 该 树 的 拓扑 图 与 图 5 一 15a 中 的 图 等 同 。 然 而 请 注意 ,在 此 法 中 最 先 相 互 结合 成 对 的 是 O 和 
R ,而 不 是 了 和 Ce。 这 是 因为 ,在 无 根 树 中 O 和 有 事实 上 就 是 近邻 .图 5 一 15b 中 的 各 枝 长 由 更 早 些 时 
给 出 的 方法 估 出 。 

最 后 ,我 们 看 看 最 节省 法 。 为 简单 起 见 ,我 们 只 考虑 人 、 黑 猩猩 ,大 猩猩 和 马 来 猩 猩 。 表 5 一 4 列 出 
了 包括 1 一 珠 蛋 白 假 基因 及 其 周围 区 域 的 .长 10. 2kb 的 片段 中 ,有 关 的 信息 位 点 (Koop 等 ,1986a; 
Miyamoto 等 ,1987; Maeda 等 ,1988) 。 每 一 位 点 所 支持 的 假定 在 最 后 一 列 中 给 出 。 如 果 我 们 只 考虑 碱 
基 改 变 , 则 15 个 信息 位 点 中 ,有 8 个 支持 人 一 黑猩猩 进化 枝 ( 假 定 I ),4 个 支持 黑猩猩 一 大 猩猩 进化 
校 ( 假 定 工 ) ,3 个 支持 人 一 大 猩猩 进化 枝 ( 假 定 开 )。 而 且 ,4 个 涉及 裂 锋 的 信息 位 点 全 部 支持 人 一 黑 狸 
猩 进化 枝 。 因 此 ,人 一 黑猩猩 进化 枝 被 选 作 最 可 能 是 真实 系统 发 育 方式 的 代表 。 在 一 次 更 详细 的 分 析 
中 ,威廉 姆 斯 和 古 德 曼 C(Williams 和 Goodman ,1989) 曾 证 明 , 有 关 支 持 人 一 黑猩猩 进化 枝 的 结果 ,有 按 
1 狼 水 平衡 量 的 统计 意义 。 


~ 
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表 5 一 4 人 、 黑 猩猩 ,大 猩猩 和 马 来 猩 猩 的 顺序 中 的 信息 位 点 


顺序 
位 点 人 黑猩猩 KBR WB ABE? 
来 自 Miyamoto 等 (1987) 的 数据 
34 A G A G I 
560 Cc C A A I 
1287 * ¢ * sig 二 I 
1338. G~ G A A I 
3057 — 3060 兴 eH xe 兴 类 TAAT TAAT I 
3272 ci AIF * * I 
4473 C C oT ay I 
5153 A G C A I 
5156 A G G A I 
5480 G G zh of I 
6368 C BD > Ah I 
6808 C T ak; CG I 
6971 G G a 到 I 
来 自 Maeda 等 (1988) 的 数据 

人 3 HEH RH OE KH H AATATA AATATA I 
1472 G G A A I 
2131 A A I 
2224 A G A G I 
2341 G a &: G C 下 
2635 G G A A I 


A Williams 和 Goodman(1989) 2X ft AK . 

a、\ 位 点 序数 对 应 于 原始 来 源 中 给 出 的 序数 。 所 用 序列 的 总 长 度 为 10. 2 kb, 约 为 表 5 一 2 中 所 用 序列 的 2 倍 。 
b、 假 定 : I ,人 和 黑猩猩 在 一 个 进化 枝 中 ; 工 , 黑 猩猩 和 大 猩猩 在 一 个 进化 枝 中 ;下 人 和 大 猩猩 在 一 个 进化 枝 中 。 
c、\ 一 个 星 号 表示 在 该 位 点 上 缺失 一 个 核 苷 酸 。 


另外 还 有 些 类 型 的 分 子 数 据 也 支持 人 和 黑猩猩 聚 类 的 结论 。 例 如 ,DNA 一 DNA 杂交 数据 (Sibley 
和 Ahlguist,1984;Caccone 和 Powell,1989) 明 确 地 表示 ,在 图 5 一 14 里 3 种 供 选取 的 系统 发 育 关系 
中 ,人 和 黑猩猩 聚 被 类 成 一 个 进化 枝 。 于 是 ,与 人 关系 最 近 的 现存 亲属 是 两 种 黑猩猩 ,其 后 为 大 猩猩 、 
马 来 猩 猩 和 9 PARR 


5.10 线粒体 和 叶绿体 的 内 共生 起 源 


基本 上 有 两 种 理论 解释 真 核 生 物 中 与 细胞 核 分 开 的 线粒体 和 叶绿体 基因 组 的 存在 。 第 二 种 理论 
例如,，Cavalier-Smith,1975) 认 为 ,细胞 器 的 基因 是 自体 起 源 的 ,是 通过 直接 的 父子 关系 从 细胞 核 基 


因 传 下 来 的 。 细 胞 核 基因 组 的 某 些 部 分 被 并 人 到 一 个 由 膜 包 被 的 细胞 器 中 ,接着 假定 它 的 准 独 立 存 


在 ,从 而 完成 了 这 一 起 源 过 程 。 与 其 不 同 的 是 ,内 共生 学 说 (例如 Margulis,1981) 认 为 核 外 DNA. 的 起 
源 是 外 源 性 的 。 按 照 这 种 看 法 真 核 生 物 的 祖先 吞噬 了 原核 生物 ,接着 ,由 于 互利 或 有 共生 关系 的 缘故 ， 
后 者 被 保留 了 下 来 。 随 着 时 间 的 流逝 ,这 种 内 共生 通过 某 些 基因 的 丢失 而 变 得 更 为 密切 ， alan 
了 强制 性 共生 者 ( 即 ,不 能 在 其 宿主 体外 独立 地 存在 的 生物 )。 
“= 现在 ,分 子 证 据 绝对 地 支持 内 共生 学 说 。 使 叶绿体 和 原核 生物 的 基因 组 与 真 核 生物 的 基因 组 区 分 
开 来 的 生化 特性 , 列 于 表 5 一 5 中 。 然 而 ,最 根本 的 文 持 来 自 IRNA 顺序 数据 。 由 于 rRNA 顺序 有 较 低 
的 替换 速率 ,所 以 ,它们 已 被 证 明 对 处 理 涉 及 非常 古老 的 进化 分 岐 事件 的 问题 是 很 有 用 的 。 

ite BL ve Fl Bt FE AR (Schwarz il Kossel, 1980) wE HA. K A AK (Zea mays) 叶 绿 体 中 的 16SrRNA ;其 
$F A FF GK A KATA CE. coli) fY 16SrRNA 的 极为 相似 。 在 细胞 核 的 和 叶绿体 的 zRNA 顺序 
la] , 这 种 类 似 程 度 就 要 低 得 多 。 来 自 光 合 蓝 细 菌 的 16SrRNA 顺序 的 详细 分 析 (Giovannovi 等 ,1988) 
支持 这 样 的 看 法 : 即 ,绿色 的 叶绿体 来 自 一 群 称 为 蓝 细菌 的 光合 细菌 (Bonen 等 ,1979)( 见 图 5 一 16a) 。 


s。 76° 


as -ec 


表 5 一 5 将 叶绿体 和 原核 生物 的 基因 组 与 真 核 生物 的 核 基因 组 区 别 开 来 的 分 子 特征 


1. 无 组 蛋白 DNA 
2. 大 小 为 120,000 一 150*000 碱 基 对 

3. 环 状 基因 组 

4. 转录 的 利 福 平 敏感 性 

5. BRE IRA HE EK . MEH .spectromycin 和 巴 龙 霉 素 抑制 
6. 翻译 对 放 线 菌 酮 的 不 敏感 性 

7. 翻译 以 甲 酰 甲 硫 氨 酸 为 起 始 

8. mRNA 的 多 聚 腺 苷 缺失 或 很 短 

9. 原核 促进 子 结构 


rRNA 顺序 的 系统 发 育 分 析 表 明 , 线 粒 体 来 自 紫色 细菌 的 a 分 枝 ( 图 5 一 16a;Cedergren 等 ， 
1988) 。 然 而 ,所 用 的 细胞 核 rRNA 顺序 指出 :高 等 植物 在 大 约 与 动物 和 真菌 相同 的 时 刻 发 生 分 枝 (图 
5 一 16b), 这 与 传统 观点 一 致 ;而 线粒体 rRNA 顺序 却 指 出 ,高 等 植物 在 非常 接近 紫色 细菌 的 根 处 聚 
类 ,与 真菌 .绿色 藻类 和 动物 则 是 分 离 的 (图 5 一 16a)。 这 是 与 传统 观点 , 即 把 高 等 植物 和 绿色 藻类 组 
合 在 一 个 进化 枝 中 的 观点 相 矛 盾 的 。 为 此 缘故 ,格雷 等 (Gray 等 ,1989) 曾 提出 ,高 等 植物 的 线粒体 中 
的 rRNA 基因 ，， 有 上 比 其 他 生物 线粒体 中 的 rRNA EE HE 此 假说 是 否 会 被 进 一 步 的 证 
据 所 支持 ,我 们 将 拭目以待 。 


5.11 分子 古 生物 学 


从 微克 量 保存 下 来 的 组 织 中 得 到 的 不 纯 样本 的 DNA, 现 在 已 有 可 能 对 它 的 片段 加 以 定 序 了 。 所 
采用 的 方法 是 聚合 酶 链 式 反 应 法 (PCR)。PCR 是 通过 应 用 两 种 已 知 引 物 来 使 某 序 列 混合 物 中 的 一 种 
独特 序列 扩 增 的 方法 (图 5 一 17; Saiki 等 ,1985,1988;Scharf 等 ,1986;Engelke #,1988). 每 一 引物 和 

一 个 DNA 的 互补 小 段 附 着 ,从 而 引发 DNA 多 聚 酶 的 结合 ,然后 拷贝 该 片段 。 由 于 每 一 新 产生 的 拷贝 
都 可 充 作 进一步 复制 时 的 模板 ,所 以 靶 片 段 的 拷贝 数 将 呈 指 数 增长 用 此 法 有 可 能 将 混合 物 中 的 某 一 
被 选 定 的 DNA 片段 合成 产生 许多 拷贝 ,此 时 混合 物 中 其 他 DNA 序列 可 能 会 远 为 超 量 地 存在 
(Kocher 等 ,1989)。 因 此 ,采用 PCR 我 们 可 以 从 博物 馆 标 本 , 象 保存 下 来 的 有 机 物质 (主要 是 皮肤 和 
肌肉 )、 严 重 损坏 的 考古 学 遗物 甚至 骨骼 中 找 回 某 些 特别 的 DNA 序列 (Hagelberg 等 ,1989) 。 

应 用 此 法 现在 已 可 能 建立 某 些 已 灭绝 物种 , 象 南非 斑 肪 和 澳大利亚 袋 狼 间 的 系统 发 育 关 系 ,或 决 
定 斯 堪 的 那 维 亚 铁 器 时 代 的 沼泽 地 人 和 埃及 木 万 伊 ,这 些 已 灭绝 人 类 群体 间 的 祖先 -后 毅 关 系 。 对 后 
两 个 人 类 群体 的 形态 学 比较 ,得 到 的 结果 比较 含糊 。 

应 用 PCR 法 ,托马斯 等 (Thomas 等 ,1989) 已 能 对 来 自 袋 狼 Thylacinus cynoce phalus 和 其 他 涡 大 
利 亚 与 南美 有 袋 类 的 线粒体 的 219 个 核 苷 酸 加 以 定 序 和 比较 ,并 且 与 来 自 有 胎盘 类 的 同 源 顺 序 比 较 。 
应 用 此 法 ,他 们 已 能 在 以 下 两 种 说 法 间作 出 取 含 :(a) 袋 狼 与 南美 的 有 袋 动物 类 群 有 亲缘 关系 ,和 (b) 
袋 狼 与 其 他 澳大利亚 有 袋 类 的 亲缘 关系 很 近 。 从 这 些 顺 序 比 较 中 得 出 的 结论 是 , 袋 狼 与 另外 两 种 澳 大 
利 亚 有 袋 类 , 儿 近 灭绝 的 塔 斯 马 尼 亚 魔鬼 (一 种 袋 获 ,Sarcopjzlus harrisii) AYR K All W. Fi (— PPAR fh. 
Dasyurus maculatus) A {BRIE RARKA (AS — BB HAAS AO (— BPE RR . Philander opossum an- 
dersoni) AA RHI MWRAKACA 5 一 18)。 于 是 , 袋 狼 和 南美 有 袋 动 物 间 形 态 学 上 的 相似 ,被 认为 是 
一 个 形态 学 水 平 上 趋同 进化 的 例子 , 它 在 线粒体 DNA 中 没有 平行 关系 。 


5.12 ” 深 色 海滩 省 :物种 保护 生物 学 中 的 一 次 教训 


最 后 一 只 深 色 海滩 省 死 于 1987 年 6 月 16 日 ,地 点 在 佛罗里达 州 俄 伦 多 附近 沃 特 . 迪斯尼 世界 
的 动物 园 里 。 深 色 海 滩 汰 在 1872 年 被 发 现 。 因 其 墨色 的 外 瑶 而 被 明确 地 归 类 成 一 AS WRC Ammodra- 
mus maritimus nigrescens) , A.m. nigrescens 的 地 理 分 布 被 限 制 在 佛罗里达 州 布 列 伐 得 县 中 的 盐 碱 沼泽 
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图 5 一 16 《〈a) 从 小 亚 基 rRNA 的 顺序 推测 出 的 无 根 树 中 真 细菌 一 叶绿体 一 线粒体 部 分 。 注 意 , 来 自 绿色 莹 类 和 植 
物 的 叶绿体 顺序 都 是 单 源 发生 的 ,而 线粒体 顺序 则 是 多 源 发 生 的 。(b) 从 细胞 核 小 亚 基 rRNA 顺序 推测 出 的 无 根 
树 。 步 聚 1( 用 圆圈 标 出) 是 早期 内 共生 、 假 定 已 产生 了 大 多 数 真 核 生 物 的 线粒体 基因 组 , 步 聚 2 是 后 期 共生 ,Gray 
等 (1989) 假 定 它 贡 献 了 高 等 植物 线粒体 的 TRNA 基因 。 每 一 分 枝 的 长 度 与 其 两 个 内 部 点 间 的 替换 数 成 比例 ,比例 
尺度 如 图 中 所 示 。 自 Gray 等 (1989) 修 改 而 成 。 
地 带 ( 图 5 一 19), 到 了 1980 年 ,自然 界 中 只 能 找到 6 个 个 体 , 全 是 雄性 。 显 然 该 群体 的 灭绝 已 命中 注 
定 , 于 是 ,一 个 人 工 杂 交 计 划 被 当 作 为 保护 该 亚 种 的 基因 的 最 后 一 搏 而 展开 了 。 

在 这 种 情况 下 ,保护 方案 就 是 将 这 些 濒 临 灭 绝 的 亚 种 的 雄性 个 体 ,与 来 自我 们 所 能 找到 的 与 其 亲 
缘 关 系 最 近 的 亚 种 的 峻 体 交 配 。 然 后 , 子 一 代 的 杂种 肉体 再 与 该 雄 体 回 交 ,它们 产生 的 后 代 又 再 次 与 
原 雄 体 回 交 ,此 过 程 循环 往复 直至 该 雄 体 死去 为 止 。 该 实验 的 关键 是 要 决定 应 从 哪 种 群体 中 选取 峻 
体 , 即 决定 哪 一 个 亚 种 在 系统 发 育 上 最 接近 该 濒临 灭绝 的 亚 种 。 

«78° 


. 
Nearer eeeerenccee ee 


扩 增 循环 


| 引物 延长 
ER 
| eam ai en 


图 5 一 17 用 聚合 酶 链 式 反应 法 (PCR) 使 混合 物 中 的 特定 DNA 序列 扩 增 。DNA 经 加 热 解 链 成 单 链 分 子 。 两 个 合成 
的 DNA 小 片段 (锯齿 状 波纹 线 ) 各 与 靶 序 列 (黑色 粗 线 ) 一 端 上 的 特别 顺序 互补 , 充 作 引物 。 每 一 引物 各 与 不 同 链 上 
的 互补 顺序 结合 。 然 后 ,DNA 多 聚 酶 通过 在 引物 上 添加 核 苷 酸 来 使 其 延长 。 很 快 地 , 靶 序 列 的 精确 复制 品 即 产生 
了 。 在 以 后 的 循环 中 ,原始 靶 序 列 及 其 复制 品 都 可 充 作 模板 。 相 反 , 不 含 与 引物 互补 的 顺序 的 DNA 分 子 则 不 被 扩 
增 。 因 此 ,不 纯 的 DNA 混合 物 也 可 用 来 只 对 其 中 的 一 种 序列 进行 扩 增 ,即使 在 其 他 序列 远 为 过 量 地 存在 的 情况 下 ， 
这 一 点 也 能 办 到 。 更 详细 说 明 见 Mullis(1990) 。 

在 海滩 省 的 例子 中 ,有 8 个 可 区 别 的 亚 种 供 选 取 。 这 些 物 种 的 地 理 分 布 范 围 如 图 5 一 19 Pe. 根 
据 形 态 学 和 行为 特征 所 作出 的 决定 是 ,最 接近 深 色 海 滩 涛 的 亚 种 为 斯 科 特 的 海滩 淮 (4. mm. 
peninsulae) ,它们 栖息 在 佛罗里达 湾 的 沿岸 。 在 此 决定 下 ,xzgrescexns 亚 种 的 几 个 雄 体 与 来 自 peninsulae 
亚 种 的 肉体 交配 。 已 取得 了 两 次 成 功 的 回 交 , 而 由 此 产生 的 群体 则 此 后 维持 近 交 ,以 期 有 一 天 能 将 这 
“重建 2 的 亚 种 放 回 到 它 原来 的 栖息 地 中 去 。 

为 了 看 一 看 该 肉体 的 选择 是 否 正 确 , 阿 维 斯 和 纳 尔 了 进 (Avise 和 Nelson ,1989) 曾 进行 过 有 关 线 粒 
体 DNA 的 限制 酶 模式 的 比较 ,材料 的 一 方 来 自己 故 的 纯 种 xzgrescens 的 标本 , 另 一 方 来 自 海滩 省 现 
存 8 个 亚 种 中 的 5 个 , 共 39 个 个 体 。 他 们 选择 线粒体 DNA AULT RA. BH. AH PR LK 
DNA 已 知 进化 非常 迅速 (第 四 章 ), 因 此 它 可 以 为 区 别 亲 缘 关 系 较 近 的 生物 提供 一 个 分 辩 率 较 高 的 解 
决 途径 。 其 次 ,线粒体 是 母系 遗传 的 ,所 以 不 会 发 生 因 等 位 基因 分 离 而 造成 的 复杂 局 面 。 最 后 ,由 于 母 
系 传 递 模 式 来 自己 故 雄 性 深 色 海滩 省 中 的 线粒体 DNA ,并 不 曾 转移 到 复原 育种 方案 中 的 杂种 个 体 
里 .所 以 ,虽然 细胞 核 中 的 某 些 基因 已 在 杂种 中 生存 了 下 来 ,但 深 色 海 滩 和 做 的 线粒体 基因 却 不 一 样 , 它 
们 是 真正 的 灭绝 了 。 

根据 限制 酶 模式 , 阿 维 斯 和 纳尔逊 (Avise 和 Nelson,1989) 用 UPGMA 法 和 最 节省 法 ,构建 出 了 
海滩 汰 几 个 亚 种 间 的 进化 关系 (图 5 一 20) 。 从 图 中 可 以 看 到 ,大 西洋 沿岸 群体 ,包括 深 色 海滩 省 在 内 ， 
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图 5 一 18 AR (Thylacinus) fo 6 tH AA RF ARG HH 12 SrRNA 顺序 作出 的 最 节省 树 。. 该 树 用 乳牛 (Bos) 作 组 
外 单位 找到 了 根 . 分 枝 上 的 数字 代表 替换 数 。 自 Thomas 等 (1989) 。 
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mirabilis 


墨西哥 湾 

5-19 RE (Ammodrumus. ar 二 ) 的 可 本 基 汪 和 LA 区 别 的 亚 种 的 地 理 分 布 。 自 Avise 和 Nelson 
(1989). | 
相互 间 几 乎 是 不 可 区 别 的 。 在 此 研究 中 3 个 海湾 沿岸 的 亚 种 也 有 同样 的 关系 。 相 比 之 下 ,大 西洋 沿岸 
亚 种 与 海湾 沿岸 亚 种 间 则 有 相当 明显 的 区 别 。 这 两 大 类 群 间 的 每 位 点 核 苷 酸 蔡 换 数 估计 约 为 1 贤 。 如 
果 海 滩 尖 的 线粒体 DNA 以 与 哺乳 类 和 其 他 鸟 类 的 线粒体 DNA 大 致 相同 的 速率 进化 ( 即 每 百 万 年 2 
一 4 狼 的 顺序 分 岐 ) ,那么 ,这 两 大 类 群 的 群体 是 在 大 约 25 万 一 50 万 年 前 发 生 分 离 的 。 虽 然 这 些 对 分 
岐 的 绝对 年 代 的 估 值 ,由 于 缺乏 确定 的 统一 标准 而 停留 在 定性 水 平 , 但 它们 却 与 已 得 到 的 海平 面 开 始 
下 降 的 年 代 一 致 得 相当 好 。 由 于 海平 面 下 降 ,佛罗里达 半岛 露出 水 面 , 从 而 对 半岛 两 侧 的 群体 起 了 生 
殖 屏障 的 作用 。 1 

更 重要 的 是 , 阿 维 斯 和 纳尔逊 (Avise 和 Nelson ,1989) 的 分 子 研究 表明 , 深 色 海 滩 兴 亚 种 与 另 两 
个 大 西洋 亚 种 ( 即 A. m. maritima Fl A. m. jaacgilliurazz) 在 分 子 上 不 可 区 别 ,而 它 与 海湾 亚 种 , 象 4. m. 
peninsulae 却 是 相当 不 同 的 ,但 繁殖 计划 中 却 从 后 者 里 选 出 肉体 。 结 果 , 深 色 海滩 省 的 救援 方案 也 许 是 


建立 在 错误 的 系统 发 育 前 提 上 的 。 该 方案 可 能 不 是 在 重建 一 个 灭绝 了 的 亚 种 ,而 是 创造 了 一 个 新 亚 


种 。 所 以 ,系统 发 育 关系 方面 的 知识 在 生物 多 样 性 的 保护 中 ,对 作出 合理 决定 是 至 关 重要 的 。 分 类 学 
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图 5 一 20 UPGMA 系统 树 图 ,表示 海滩 和 瞧 的 大 西洋 沿岸 群体 和 海湾 沿岸 群体 间 的 线粒体 DNA 基因 型 区 别 。 应 用 
最 节省 法 可 得 到 许多 同样 节省 的 树 , 其 中 包括 与 所 示 图 等 同 的 树 。 所 有 供 选 取 的 树 都 涉及 大 西洋 进化 枝 内 部 或 海 
湾 进 化 枝 内 部 少量 的 分 枝 重 排 ,但 这 两 个 类 群 间 的 界线 却 维持 不 变 。 系 统 树 图 中 同样 的 亚 种 名 多 次 出 现 ,这 表示 属 
于 同一 亚 种 的 不 同 个 体 展 现 出 不 同 的 限制 酶 模式 。 反 之 , 几 个 亚 种 名 在 一 个 分 枝 的 末端 处 出 现 则 表示 ,根据 形态 学 
和 动物 地 理学 而 被 归于 不 同 亚 种 的 某 些 个 体 , 对 所 使 用 的 那些 酶 表现 出 相同 的 限制 酶 模式 。 自 Avise 和 Nelson 
(1989). 


上 的 失误 也 许 会 使 那些 愿望 良好 的 努力 变 得 劳 而 无 功 。 
习题 


1. 对 4 个 OTU:A,B,C 和 D, 画 出 所 有 可 能 的 有 根 和 无 根 树 。 
2. 找 出 以 下 5 个 假想 顺序 中 的 所 有 信息 位 点 
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$ 3. (a) 用 UPGMA 法 ,(b) 用 变形 距离 法 ,和 (c) 用 萨 塔 特 和 特 韦 尔 斯 基 的 近邻 关系 法 ,对 以 下 距 
离 矩 阵 构建 系统 树 。 在 变形 距离 法 的 场合 ,假定 OTU E 对 所 有 其 他 OTU 而 言 是 一 个 已 知 的 组 外 单 


fii . 
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4. 图 5 一 15b 中 的 树 是 用 萨 塔 特 和 特 韦 尔 斯 基 的 近邻 关系 法 得 到 的 ( 见 第 66-67 页 和 74 一 75 
e Site 


页 ) 。 请 用 第 69-70 页 里 介绍 的 方法 证 明 在 该 树 上 所 标 出 的 枝 长 。 
5. 在 经 典 昆 虫 分 类 学 中 ,不 完全 变态 类 (如 直 翅 目 ) 和 完全 变态 类 (如 双 翅 目 、 鳞 翅 目 , 同 翅 目 ) 间 

的 分 岐 曾 被 假定 是 非常 远古 的 事件 。(a) 用 图 5 一 21 中 的 6 个 5SrRNA 顺序 和 UPGMA 法 来 构建 系 

统 树 。(b) 用 其 中 5 个 顺序 (ab.c.e 和 1f 和 最 节省 法 来 构建 一 个 无 根系 统 树 。 把 根 放 在 联结 组 外 单位 | 

Artemia salina ({) #l #4 OTU 的 分 枝 上 。 这 两 种 树 与 经 典 分 类 学 结果 一 致 吗 ? 这 两 种 构建 法 结果 能 得 

到 相同 的 拓扑 图 吗 ? 如 果 不 同 , 那 么 造成 这 种 差异 的 原因 是 什么 ? 


(a) GCCAACGTCCATACCACGTTGAAAGCACCGGTTCTCGTCCGATCACCGAAGTTAAGCAGC 
(b) GGCAACGACCATACCACGTTGAATACACCAGTTCTCGTCCGATCACTGAAGTTAAGCAAC | 
(C) GCCAACGTCCATACCACGTTGAAAACACCGGTTCTCGTCCGATCACCGAAGTCAAGCAAC 

(d) GCCAACGTCCATACCACGTTGAAAACACCGGTTCTCGTCCGATCACCGAAGTTAAGCAAC 
(e) GCCAACGACCATACCACGCTGAATACATCGGTTCTCGTCCGATCACCGAAATTAAGCAGC 
(人 ACCAACGGCCATACCACGTTGAAAGTACCCAGTCTCGTCAGATCCTGGAAGTCACACAAC 


(a) GTCGGGCGCGGTTAGTACTTGGATGGGTGACCGCCTGGGAACCCCGCGTGACGTTGGCA 
(bb) GTCGGGCGTAGTTAGTACTTGGATGGGTGACCGCTTGGGAACACTACGTGCCGTTGGCA 
(c) GTCGGGCGTAGTCAGTACTTGGATGGGTGACCGCCTGGGAACACTACGTGATGTTGGCT 
(d) GTCGGGCGCGGTCAGTACTTGGATGGGTGACCACCTGGGAACACCGCGTGCCGTTGGCT 
(e) ETCGGGCGCGGTTAGTACTTAGATGGGGGACCGCTTGGGAACACCGCGTGTTGTTGGCC 
() GTCGGGCCCGGTCAGTACTTGGATGGGTGACCGCCTGGGAACACCGGGTGCTGTTGGCA 


图 5 一 21 ABA 6H PR AwH SS rRNA AHH DNA WMA. (a) & (Acheta domesticus, HA) (b) HF & (A- 
cyrthosi phon magnoliae , 8 A) (c) ¥& (Bombyx mori, H 38H )(d) # (Philosamia cynthia , $ 38 BH ) (e) 3 (Drosophila 
melanogaster , % #8 A) (f) F 7 HAM (Artemia salina, ¥ 7% A). HARK A Kawata 和 Ishikawa( 1982) ,Morton 和 Sprague 
(1982) ,Gu # (1982) ,Bagshaw # (1987) ,Cave 等 (1987) ,以 及 Samson 和 Wegnez(1988) 。 
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6 由 基因 重复 和 外 显 子 混 匀 造 成 的 进化 


最 先 注意 到 基因 重复 在 进化 中 的 重要 性 的 是 霍 尔 丹 (Haldane,1932) 和 马 勒 (Muller,1935)。 他 们 
认为 ,一 个 基因 的 多 余 复 本 也 许 能 发 生 引起 岐 化 的 突变 ,因而 最 终 将 会 以 一 个 新 基因 的 形式 出 现 。 大 
BF (Ohno,1970) 以 分 子 的 .生物 化 学 的 和 细胞 学 的 证 据 为 赁 ,把 这 种 看 法 引 向 了 极端 ,主张 基因 重复 
是 唯一 能 引起 新 基因 产生 的 途径 。 虽 然 ,现在 已 经 知道 还 有 一 些 别 的 产生 新 功能 的 方式 ( 见 第 95-96 
页 ) ,但 大 野 的 观点 在 很 大 程度 上 还 是 成 立 的 。 

断裂 基因 的 发 现 启 发 了 吉尔 伯 特 (Gilbert,1978) ,于 是 他 提出 ,内 含 子 间 的 重组 为 基因 间 外 显 子 
序列 交换 提供 了 一 种 机 制 . 已 经 发 现 的 许多 这 类 外 显 子 交 换 的 例子 表明 ,这 种 机 制 在 真 核 生物 的 基因 
以 出 现 新 功能 的 形式 进化 中 ,起 着 十 分 显著 的 作用 。 


6.1 DNA 重复 的 类 型 


— DNA 片段 的 拷贝 数 增 加 可 由 几 种 类 型 的 DNA 重复 (CDNA duplication) 所 引起 。 这 通常 根据 
所 涉及 的 基因 组 区 域 的 幅度 来 分 类 。 已 经 知道 有 以 下 几 种 类 型 的 重复 :(1) 部 分 基因 重复 或 基因 内 重 
(partial or internal gene duplication),(2) 全 基因 重复 (complete gene duplication) ) ,(3) 部 分 染色 体重 
(partial chromosomal duplication)、，(4) 非 整数 倍 重复 或 染色 体重 复 (aneuploidy or chromosomal du- 
plication), 和 (5) 多 倍 性 重复 或 基因 组 重复 (polyploidy or genome duplication) 。 前 4 种 类 型 又 称 区 域 
性 重复 (regional duplication) ,因为 它们 影响 的 不 是 整个 单 倍 的 染色 体 组 .大 野 (Ohno,1970) 曾 极 力主 
张 ,基因 组 重复 一 般 要 比 区 域 性 重复 更 为 重要 一 些 , 因 此 在 后 一 种 情况 下 , 结构 基因 的 调节 系统 可 能 
只 有 部 分 发 生 了 重复 ,而 这 种 不 平衡 可 能 会 破坏 重复 基因 的 正常 功能 .然而 ,正如 以 下 所 讨论 的 ,区 域 
性 重复 显然 在 进化 中 也 起 着 非常 重要 的 作用 。 

DNA 重复 长 期 以 来 一 直 被 认为 是 造成 基因 组 大 小 进化 的 一 个 重要 因素 ( 见 Ohno,1970)。 特 别 
地 ,全 基因 组 重复 或 它 的 某 一 主要 部 分 ,如 一 条 染色 体 的 重复 ,可 能 会 造成 基因 组 大 小 突然 而 极 大 的 
增长 。 基 因 组 重复 事件 曾 在 各 种 不 同 的 生物 类 群 的 进化 中 反复 地 被 记录 到 ,而 在 植物 、 真 骨 鱼 类 和 两 
栖 类 中 最 为 突出 。 造 成 基因 组 扩大 的 进化 途径 将 在 第 八 章 中 进行 讨论 。 


6.2 域 和 外 显 子 


一 个 蛋白 质 域 (domain) 是 蛋白 质 中 一 个 定义 明确 的 区 域 , 它 区 别 于 蛋白质 中 的 其 它 部 分 ,或 者 执 
行 某 一 特殊 功能 ,如 与 基质 结合 ,或 者 构成 该 蛋白 质 内 的 一 个 稳定 、 紧 密 的 结构 单位 ,前 者 称 为 功能 域 
(functional domain) ， 后 者 则 称 结构 域 (structural domain ) 或 组 件 (module)(Go 和 Nosaka,1987)。 定 
义 一 个 功能 域 的 边界 常常 是 很 困难 的 ,因为 在 许多 情况 下 功能 是 由 散布 在 整个 多 肽 里 的 氨基 酸 残 基 
执行 的 。 另 一 方面 ,一 个 结构 组 件 则 是 由 一 段 连续 的 氨基 酸 片段 所 构成 的 。 

在 考虑 产生 多 重 域 蛋白 质 的 可 能 进化 机 制 时 ,以 上 区 别 是 相当 重要 的 .如 果 一 个 功能 域 相当 于 一 
个 组 件 ,那么 , 它 的 重复 将 会 增加 功能 片段 的 数目 .反之 ,如 果 功 能 是 由 散布 在 不 同 组 件 中 的 氨基 酸 残 
基 执 行 的 , 则 一 个 组 件 重 复 所 造成 的 影响 也 许 从 功能 上 看 是 不 成 气候 的 。 在 许多 蛋白 质 中 看 到 的 内 部 
重复 常常 对 应 于 结构 组 件 或 者 单 组 件 的 功能 域 (Barker 等 ,1978 ) 。 

从 理论 上 讲 ,结构 域 和 外 显 子 在 基因 中 的 排列 间 也 许 能 设想 出 几 种 可 能 的 关系 (图 6 一 1)。 乡 
(Go,1981) 发 现 ,在 许多 内 部 结构 域 划分 已 经 确定 的 球状 蛋白 质 中 ,基因 的 外 显 子 和 该 域 之 间或 多 或 
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加 | 外 显 子 1 HEF2 HEF3 外 显 子 4 


基因 
蛋白 质 
(b) 外 显 子 1 外 显 子 2 外 显 子 3 外 显 子 4 
基因 
ZE 蛋白 质 
G 外 显 了 1 外 显 子 2 
基因 


(dj) BFL ”外 显 子 2 外 显 子 3 “外 显 子 4 外 显 子 5 外 显 子 6 - 
基因 


人 SEF1 ”外 显 子 2 ”外 显 子 3 HBTS HBTS 


图 6 一 1 基因 中 外 显 子 的 排列 与 它 所 编码 的 蛋白 质 的 结构 域 之 间 的 可 能 关系 :(a) 每 一 外 显 子 正 好 对 应 于 一 个 结 
构 域 ;(b) 仅 近似 地 对 应 ;(c) 一 个 外 显 子 为 两 个 或 更 多 的 域 编 码 ;(d) 一 个 结构 域 由 2 个 或 多 个 外 显 子 编码 ;和 (e) 外 
显 子 和 域 之 间 不 对 应 。 该 蛋白 质 的 4 个 结构 域 用 不 同 的 矩形 块 ( 画 有 斜 条 纹 的 ,黑色 的 、 白 色 的 和 打上 点 的 ) 表 示 。 

少 地 存在 着 精确 对 应 (图 6 一 la\b)。 在 某 几 个 例子 中 ,可 看 到 一 个 组 件 由 一 个 以 上 的 外 显 子 编码 的 现 
象 图 (6 一 1d)。 在 她 的 研究 中 ,没有 发 现 一 个 蛋白 质 的 组 件 结构 与 其 基因 的 外 显 子 划分 间 完 全 不 二 臻 
的 情况 \ 图 6 一 le)。 然 而 ,在 为 数 不 少 的 例子 中 , 却 可 以 看 到 儿 个 邻近 的 域 是 由 同一 个 外 显 子 编码 的 
(图 6 一 lc)。 例 如 ,血红 蛋白 和 有 分 别 由 4 个 域 构成 ,而 它们 的 基因 却 只 分 别 由 3 个 外 显 子 所 组 成 ， 
其 中 第 2 个 外 显 子 则 为 2 个 邻近 的 域 编码 。 乡 认为 ,由 于 两 个 外 显 子 间 的 内 含 子 丢失 ,结果 出 现 了 两 
外 显 子 的 合并 。 事 实 上 ,存在 于 植物 中 的 同 源 蛋 白质 一 一 豆 血 红 和 蛋白, 其 基因 中 就 可 看 到 在 由 珠 蛋 白 
的 域 结构 预测 的 位 置 处 (第 68 个 氨基 酸 之 后 ) 正 好 含有 一 个 额外 的 内 含 子 。 所 以 , 珠 蛋 白 基因 家 族 进 
化 期 间 , 有 的 谱系 失去 了 一 些 或 者 全 部 内 含 子 (图 6 二 2)。 

在 大 多 数 情 况 下 ,蛋白质 水 平 上 的 域 重复 常 指示 出 在 'DNA KE EMT EF ES. HUE 
表明 外 显 子 重复 是 内 部 重复 的 最 重要 类 型 之 一 。 真 核 生 物 的 基因 一 般 由 许多 外 显 子 和 内 含 子 组 成 第， 
一 章 六 而 相 邻 的 外 显 子 常常 是 等 同 的 或 相互 间 非 常 相似 的 。 这 些 事实 表明 ,现代 生物 中 许多 复合 基因 
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Sao SaaS 人 ET 于 -二 -二 
豆 血 红 蛋 白 基因 肌 红 蛋白 基因 冰 椎 动物 珠 蛋白 基因 He AeA 


| 全 部 内 合子 丢失 
中 心 内 含 子 丢失 


祖先 珠 蛋 白 基 因 


图 6 一 2 珠 蛋 自 基 因 进 化 期 间 的 内 含 子 丢失 。 原始 珠 蛋 白 基 因 有 3 个 内 含 子 和 4 个 外 显 子 。 豆 血红 有 蛋白 基因 保留 

着 祖先 结构 ,而 其 他 谱系 则 至 少 丢 失 了 一 个 内 含 子 。 注 意 , 内 合子 并 未 按 比例 大 小 画 。 哺 乳 动物 ( 牛 ,人 ,小 鼠 , 猪 和 

海 鹏 ) 的 肌 红 有 蛋白 基因 中 的 两 个 内 含 子 长 各 为 一 4800bp 和 一 3400bp, ,而 珠 蛋 白 和 豆 血 红 蛋 白 基 因 的 同 源 内 含 子 则 

分 别 只 有 108 一 192bp 和 103 一 904bp 长 。 豆 血红 蛋白 基因 的 中 间 内 仿 子 为 99 一 234bp 长 (Blanchetot 等 ,1983) 。 珠 

蛋白 的 资料 来 自 许 多 两 栖 类 , 岛 类 和 哺乳 类 。 豆 血红 蛋白 的 资料 来 自 3 种 豆 类 (Phaseolus vulgaris, Glycine max 和 

Vicia faba) 。 
是 通过 原始 基因 的 内 部 重复 和 随后 的 修饰 进化 而 来 的 。 这 类 原始 基因 假定 只 含 1 个 或 少数 几 个 外 显 
子 , 且 只 能 执行 简单 的 生物 学 功能 (Li,1983) 。 


6.3 域 重 复 和 基因 的 延长 


对 真 核 生物 的 现 有 基因 的 勘测 表明 ,内 部 重复 在 进化 中 是 频繁 发 生 的 。 这 种 在 基因 大 小 上 的 增 
加 ,或 基因 的 延长 (gene elongation) ,是 简单 基因 回复 合 基因 进化 中 最 重要 的 步骤 之 一 。 理论 上 基因 的 
延长 也 可 通过 其 他 方式 发 生 .。 例 如 ,将 一 个 终止 密码 子 转变 成 一 个 有 意义 的 密码 子 的 突变 也 能 使 基因 
延长 (第 一 章 )。 类 似 地 ,一 个 外 来 DNA 片段 插入 某 一 外 显 子 中 ,或 出 现 删 除 拼接 位 点 的 突变 ,也 能 得 
到 同样 的 结果 。 不 过 ,这 类 分 子 变 化 大 多 数 将 破坏 延长 后 的 基因 的 功能 ,因为 加 进去 的 区 域 是 由 几乎 
随机 排列 的 氨基 酸 所 构成 的 。 事 实 上 ,在 绝 大 多 数 情 况 下 ,这 类 分 子 变化 是 与 病理 学 表象 一 起 而 被 发 
现 的 。 例 如 ,异常 血红 蛋白 恒 春 (Constant Spring) 和 Icaria 分 别 是 由 将 终止 密码 子 变 成 谷 氨 酰 胺 和 赖 
氨 酸 的 突变 所 引起 的 。 由 于 这 种 突变 ,这 些 变异 型 的 w 链 上 增加 了 30 $A (Weatherall 和 Clegg, 
1979)。 相 比 之 下 ,一 个 结构 域 的 重复 倾向 不 会 造成 这 类 问题 。 事 实 上 ,这 类 重复 有 时 甚至 能 加 强 新 产 
生 的 蛋 自 质 的 功能 ,例如 ,增加 活性 位 点 的 数目 即 可 达到 这 一 点 。 

所 以 ,进化 期 间 基 因 的 延长 看 来 主要 靠 域 的 重复 来 实现 。 在 下 节 中 ,我 们 将 给 出 一 个 基因 内 重复 
的 例子 ,以 说 明 进 化 期 间 基 因 延 长 的 后 果 。 


卵 类 粘 蛋白 基因 


卵 类 粘 蛋 白 是 一 种 存在 于 鸟 类 的 卵 白 中 的 蛋白 质 , 它 能 抑制 一 种 催化 蛋白 质 分 解 的 胰 蛋 白 酶 的 
活性 。 卵 类 粘 蛋 白 多 肽 可 被 划分 成 3 个 功能 域 (图 6 一 3)。 每 一 个 域 都 能 和 一 个 分 子 的 胰 蛋 和 白 酶 或 其 
他 丝氨酸 类 蛋白酶 结合 。 为 这 3 个 功能 域 编 码 的 DNA 区 域 明 显 地 有 着 共同 的 进化 起 源 , 且 相互 间 由 
内 含 子 所 隔 开 (Stein 等 ,1980)。 这 3 个 区 域 中 ,每 一 个 都 是 由 被 一 个 内 含 子 隔 断 的 两 个 外 显 子 所 构 
成 , 且 这 两 个 外 显 子 间 不 表现 出 相似 。 于 是 , 卵 类 粘 蛋 白 基 因 看 来 是 由 一 个 原始 的 单 域 基因 经 两 次 内 
部 重复 而 得 来 的 ,其 中 每 次 重复 都 涉及 两 个 邻近 的 外 显 子 。 由 于 域 I 和 工 相互 间 比 它 们 中 的 任 一 个 和 
域 革 之 间 都 更 为 相似 ,所 以 它们 可 能 是 经 第 2 次 重复 而 得 到 的 ,而 域 正则 是 第 1 次 重复 的 产物 。 
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表 6 一 1 列 出 了 几 个 证 据 表 明 它 们 在 其 进 史 中 发 生 过 内 部 重复 的 基因 名 单 。 这 些 基 因 全 
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相似 性 百分数 


域 AEB BEM 


I vs. I 46 66 
II vs. II 30 42 
I vs. II 33 50 


图 6 一 3 分 尖 性 卵 类 粘 蛋 白 的 3 PAIR, PAMRRRKES MER K+ HMMA. A Stein F, (1980). 
表 6 一 1 具有 内 部 域 重 复 的 蛋白 质 


序 OB 蛋白 质 的 长 度 。 重复 的 长 度 重复 的 次 数 重复 的 百分比 
免疫 球 蛋 白 E- 链 C 区 (人 ) 423 108 4 100 
免疫 球 蛋白 7Y- 链 C 区 (人 ) 329 108 3 98 
血清 白 蛋白 (人 ) 584 195 3 100 
小 白 蛋白 (人 ) 108 a5 2 72 
蛋白 酶 抑制 因子 ,Bowman-Birk 型 (大 豆 ) 71 28 2 79 
蛋白 酶 抑制 因子 , 颌 下 腺 型 ( 吵 齿 类 ) 115 54 2 94 
KAKA (Clostridium pasteurianum) 55 28 2 100 
ii AF ES FE IR COA) 790 79 5 50 
钙 依 赖 性 调节 蛋白 (人 ) 148 74 2 100 
原 肌 球 蛋白 < 链 ( 人 ) 284 42 7 100 


A Barker 4 (1978) 
a 氨基 酸 残 基数 。b. 由 重复 顺序 占据 的 部 分 占 蛋 白质 总 长 的 百分比 。 
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都 涉及 一 个 或 多 个 域 重 复 ,而 其 中 有 些 序列 则 是 由 一 个 原始 序列 经 多 次 重复 而 得 到 的 ,结果 使 这 种 重 
复 性 结构 占据 了 整个 蛋白 质 的 长 度 。 在 这 些 例 子 中 ,每 一 例 的 重复 事件 都 可 从 和 蛋白质 或 DNA 顺序 的 
类 似 而 轻易 地 推测 出 来 .也 许 还 有 许多 别 的 复合 基因 也 是 经 基因 内 重复 而 进化 的 ,但 它们 的 重复 区 域 
相互 间 可 能 已 分 岐 到 这 样 一 种 程度 ,以 致 它们 间 的 顺序 同 源 性 已 经 不 能 被 辨认 出 来 了 。 在 某 些 情 况 
下 ,如 免疫 球 蛋 白 基因 的 恒定 区 和 可 变 区 ,我 们 可 以 通过 比较 这 些 域 的 二 级 结构 来 推测 其 共同 祖先 ， 
因为 二 级 结构 有 比 氨 基 酸 顺序 更 强 的 保守 性 .所 以 ,蛋白 质 中 的 内 部 重复 极 有 可 能 比 经 验 数据 所 指示 
的 更 多 地 普遍 地 存在 着 。 


6.4 基因 家 族 的 形成 与 新 功能 的 获得 


一 次 全 基因 重复 产生 两 个 等 同 的 拷贝 。 它们 将 如 何 进化 则 会 因 情 况 而 异 。 例 如 ,这 些 拷 贝 可 能 保 
留 其 原始 功能 ,从 而 使 该 生物 产生 更 多 的 某 种 RNA 或 蛋白 质 。 此 外 ,其 中 一 个 拷贝 可 能 会 因 一 次 有 
害 突变 而 丧失 能 力 , 从 而 变 成 一 个 无 功能 的 假 基 因 ( 见 第 89 页 )。 然 而 ,更 重要 的 是 ,基因 重复 可 能 会 
导致 产生 遗传 新 型 或 新 基因 的 结果 。 如 果 重 复 中 一 个 拷贝 保留 其 原始 功能 ,而 另 一 个 则 累积 分 子 变 
化 ,以 致 于 最 终 变 得 能 执行 完全 不 同 的 功能 ,那么 ,产生 遗传 新 型 或 新 基因 的 情况 就 会 出 现 了 。 

重复 的 基因 可 以 分 成 两 类 :变异 的 重复 和 不 变 的 重复 。 不 变 的 重复 (invariant repeats) 相 互 间 在 顺 
序 上 是 等 同 的 或 近似 地 等 同 的 。 在 有 些 情 况 下 表明 ,等 同 顺序 的 重复 与 某 一 基因 产物 的 增 量 合成 有 
关 , 该 产物 则 是 生物 的 正常 功能 所 必需 的 。 这 样 的 重复 称 为 剂量 重复 (dose repetitions) 。 无 论 何 时 出 现 
需 产 生 大 量 特别 的 RNA 或 蛋白 质 产物 的 代谢 需要 ,剂量 重复 就 会 十 分 普遍 的 出 现 (Ohno,1970)。 代 
表 性 的 例子 有 :执行 翻译 功能 不 可 缺少 的 rRNA 的 基因 和 tRNA 的 基因 ,以 及 染色 体 首要 结构 蛋白 ， 
组 蛋白 的 基因 ,因此 必须 被 大 量 地 合成 。 

变异 的 重复 (variant repeats) 由 一 个 基因 的 多 拷贝 所 构成 ,虽然 这 些 找 贝 相 互 类 似 , 但 在 其 顺序 方 
面 却 或 多 或 少 地 有 一 定 程 度 的 差异 。 有 趣 的 是 ,变异 的 重复 有 时 能 执行 显然 不 同 的 功能 。 例 如 ,在 血 
液 凝结 过 程 中 起 裂解 血 纤 蛋 白 原作 用 的 凝血 酶 ,和 消化 性 酶 胰 蛋 白 酶 ,都 是 源 自 一 个 原始 基因 的 重 
复 。 类 似 地 , 乳 清 蛋白 ,催化 乳糖 合成 的 酶 的 一 个 亚 基 , 和 通过 裂解 某 些 细菌 细胞 壁 中 的 多 糖 成 份 来 溶 
解 它们 的 溶菌 酶 ,在 谱系 上 是 相关 的 。 功 能 上 的 分 化 通常 需要 大 量 的 替换 。 不 过 ,在 某 些 情况 下 ,一 个 
新 的 功能 有 可 能 在 数目 相对 较 小 的 替换 之 后 产生 (例如 , 见 Betz 等 ,1974) 。 

在 一 个 基因 组 中 属于 某 一 群 重复 顺序 的 所 有 基因 , 合 起 来 被 称 为 一 个 基因 家 族 (gene family ) 或 
多 基因 家 族 Cmultigene family) 。 一 个 基因 家 族 的 成 员 通 常 位 于 同一 染色 体 上 相互 间 极 靠近 的 地 方 。 在 
某 些 情况 下 ,一 些 功能 性 的 或 非 功 能 性 的 家 族 成 员 可 能 会 位 于 别 的 染色 体 上 。 

当 重 复 基因 在 功能 或 顺序 上 变 得 相互 间 差 异 很 大 时 ,再 把 它们 归 成 同一 基因 家 族 也 许 就 不 合适 
了 。 戴 霍 夫 (Dayhoff,1978) 造 了 一 个 词 : 超 家 族 (superfamily) 来 描绘 关系 密切 和 关系 朴 远 的 蛋白 质 间 
的 联系 。 据 此 ,在 氨基 酸 水 平 上 相互 至 少 展示 出 50% 相 似 性 的 蛋白 质 , 可 以 被 看 成 是 一 个 家 族 的 成 
员 ; 而 当 同 源 蛋 白质 展示 出 的 相似 性 小 于 50% 时 则 被 看 成 是 一 个 超 家 族 的 成 员 。 例如 ,a 一 珠 蛋白 和 
一 珠 蛋 白 被 分 类 在 两 个 不 同 的 家 族 中 ,而 它们 和 肌 红 蛋白 一 起 则 构成 了 珠 蛋 白 超 家 族 ( 见 第 99 页 ) 。 
然而 ,这 两 术语 并 不 总 是 能 按 戴 霍 夫 的 标准 来 严格 地 应 用 的 。 例 如 ,人 和 鲁 的 w 珠 蛋 白 链 仅 展现 出 
46 听 的 顺序 相似 性 ,这 就 低 于 为 归于 同一 基因 家 族 所 划 的 界限 。 为 此 缘故 ,将 蛋白 质 归 类 成 家 族 和 超 
家 族 , 不 仅 要 根据 顺序 的 相似 性 ,而 且 还 要 考虑 关于 功能 类 似 性 或 组 织 特异 性 等 方面 的 辅助 证 据 才 能 
决定 。 

基因 家 族 内 的 基因 数 变化 极 大 。 有 些 基 因 仅 在 基因 组 内 重复 几 次 ,它们 被 称 为 轻 度 重复 (lowly 
repetitive) 。 另 一 些 则 可 能 在 基因 组 中 上 百 次 地 重复 ,因而 被 称 为 是 高 度 重 复 的 (highly repetitive) 。 在 
以 下 几 节 中 ,rRNA 和 tRNA 基因 将 被 作为 例子 ,以 说 明 高 度 重 复 的 不 变 基因 。 轻 度 重复 的 基因 将 由 
同 功 酶 和 色 敏 感 的 色素 蛋白 基因 作 代表 。 


确定 RNA 的 基因 
表 6 一 2 列 出 了 几 种 有 机 体 的 rRNA 和 tRNA 基因 的 数目 .哺乳 动物 的 线粒体 基因 组 只 含有 一 个 
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拷贝 的 12SrRNA 基因 和 一 个 拷贝 的 16SrRNA 基因 。 这 对 线粒体 翻译 系统 来 说 显然 是 足够 了 ,因为 

其 基因 组 仅 含 13 个 为 蛋白 质 编码 的 基因 (第 四 章 )。 枝 原 体 是 最 小 的 自我 复制 的 原核 生物 , 它 含 有 两 

组 rRNA 基因 。 大 肠 杆菌 的 基因 组 大 小 是 它 的 4 一 5 倍 , 含 有 7 组 rRNA 基因 。 酵 母 中 TRNA 基因 的 

数目 大 约 是 140.2 PAA THR AMW EK. MM Xenopus laevis 有 比 人 更 大 的 基因 组 和 更 多 的 

rRNA 基因 。 所 以 ,rRNA 基因 的 数目 与 基因 组 大 小 间 存 在 着 很 强 的 正 相 关 。 这 一 规则 对 tRNA 基因 

( 表 6 一 2) 和 其 他 确定 RNA 的 基因 来 说 也 是 成 立 的 。 
表 6 一 2 各 种 有 机 体 中 每 单 倍 体 基因 组 的 rRNA 和 tRNA 基因 数 


rRNA 基因 的 tRNA 基因 组 的 
基因 组 来 源 
数目 基因 的 数目 近似 大 小 (bp) 
人 线粒体 1 22 137 104 
枝 原 体 Mycoplasma capricolum 2 ND» 11.08 
KBHE E. coli ia ~100 4X 108 
酵母 Saccharomyces cerevisiae ; ~140 320—400 5107 
果 蝇 D. melanogaster 130—250 HT 5 Que > 2X108 4 
人 ~ 300 ~1300 3x 109 
IN WE Xenopus laevis 400—600 ~7800 8X 10° 
A Li(1983) 
a. 对 于 rRNA 基因 ,该 值 指 整 个 rRNA 基因 组 的 数 。 
b. ND=X#. 


ny Be BS HY SE, 2 rRNA 基因 ,一 般 相 互 间 是 非常 相似 的 。 造 成 这 种 同 源 性 的 一 个 因素 可 能 是 


纯洁 化 选择 ,因为 这 些 基 因应 该 遵守 非常 特殊 的 功能 和 结构 要 求 。 然 而 , 同 源 性 常常 会 延伸 到 没有 任 
何 功 能 意义 的 区 域 , 而 这 类 同 源 性 的 维持 就 需要 求助 于 别 的 机 制 ( 见 第 99 页 ) 了 。 
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除了 不 变 的 重复 以 外 ,高 等 生物 的 基因 组 还 含有 许多 其 成 员 相 互 间 已 发 生 不 同 程度 岐 化 的 多 基 
因 家族 . 其 中 最 能 说 明 问题 的 例子 是 为 同 功 酶 编码 的 基因 家 族 , 象 乳酸 脱 氢 酶 、 醛 缩 酶 . 肌 酸 激酶 和 两 
酮 酸 激 酶 等 。 同 功 酶 (isozymes) 是 催化 同样 的 生化 反应 、 但 在 组 织 特异 性 .生长 调控 .电泳 移动 性 或 生 
化 特性 等 方面 相互 间 可 能 有 差别 的 一 类 酶 。 注 意 , 同 功 酶 是 由 不 同 的 基因 座位 ,通常 是 重复 后 的 基因 
来 编码 的 ,这 与 异型 酶 (allozymes) 不 同 , 后 者 是 由 同一 个 基因 座位 上 的 不 同等 位 基因 编码 的 、 某 种 酶 
的 不 同形 式 。 

让 我 们 来 考虑 为 兰 椎 动物 中 乳酸 脱 氢 酶 (LDH) 的 A 和 了 B 亚 基 编 码 的 两 个 基因 。 这 两 种 亚 基 可 形 
成 5 种 四 聚 体 同 功 酶 :Ai,A:B,A:B,,AB: 和 了 B,, 所 有 这 些 酶 都 可 在 氧化 态 辅酶 ,尼克 酰胺 腺 味 叭 二 核 
音 酸 (NAD+) 的 存在 下 催化 将 乳酸 转变 成 丙酮 酸 的 反应 ,或 在 还 原 态 辅酶 (NADH) 的 存在 下 催化 相 
反方 向 的 反应 。 曾 经 有 人 提出 ,LDH 一 B, 和 另外 一 些 富 含 B 亚 基 的 同 功 酶 对 NAD+* 有 较 高 的 亲 和 人 性， 
它们 在 一 些 行 有 氧 代谢 的 组 织 如 心脏 中 ,行使 着 真正 的 使 乳酸 脱氧 酶 的 功能 ,而 LDH 一 A, 和 另 一 些 
富 含 A 亚 基 的 同 功 酶 则 对 NADH 有 较 高 的 亲 和 性 ,所 以 ,它们 在 一 些 无 氧 代谢 的 组 织 如 骨骼 肌 里 ， 
被 特别 地 安排 作为 丙酮 酸 还 原 酶 而 起 作用 (Everse 和 Kaplan,1975;Nadal-Ginard 和 Markert,1975). 
图 6 一 和 展示 了 心脏 中 产生 的 LDH 的 发 育 次 序 。 我 们 看 到 ,心脏 存在 的 环境 越 是 厌 氧 ,特别 是 在 怀孕 
的 早期 阶段 , 则 富 含 A 亚 基 的 LDH 同 功 酶 所 占 的 比例 就 越 高 。 于 是 ,这 两 个 重复 基因 已 对 不 同 的 组 
织 和 不 同 的 发 育 阶 段 发 生 了 特 化 。 因 为 这 两 种 亚 基 存在 于 几乎 所 有 曾 做 过 年 代 测 定 研究 的 兰 椎 动物 
中 ,所 以 ,产生 LDH--A 1 LDH—B 的 基因 重复 可 能 发 生 在 养 椎 动物 进化 的 早期 阶段 之 前 或 期 间 。 
LDH 的 一 个 有 趣 特 性 是 ,这 两 个 亚 基 能 形成 异 源 多 聚 体 , 从 而 进一步 增加 了 该 酶 的 生理 学 功能 多 样 
性 。 
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图 6 一 4 心脏 中 5 种 乳酸 脱 氢 酶 (CDHJ) 同 功 酶 的 发 育 次 序 。 负 数 和 正 数 分 别 表示 出 生前 、 后 的 天 数 。 方 块 表示 B 亚 
基 、 圆 圈 表 示 A 亚 基 。 被 涂 黑 了 的 图 形 表 示 在 数量 上 占 优 势 的 形式 。 注 意 在 个 体 发 育 期 间 从 A LABQBLAHHK 
移 。 资 料 取 自 Markert 和 Vrsprung(1971). 


色 敏 感 色素 蛋白 


人 、 狼 和 古 世 界 猴 具 有 3 种 色 敏 感 色素 蛋白 。 蓝 色素 由 一 个 常 染 色 体 基因 编码 ,而 红色 素 和 绿色 
素 则 各 由 一 个 X- 连 锁 基 因 编 码 (Nathans 等 ,1986)。 红 和 绿色 素 的 氨基 酸 顺 序 有 UKESAN ME 
们 与 蓝 色 素 的 相似 性 却 只 有 43% 。 蓝 色素 基因 和 绿 、 红 色素 基因 的 祖先 在 大 约 5 亿 年 前 发 生 分 岐 。 相 
比 之 下 , 红 和 绿色 素 间 的 紧密 连锁 和 高 度 的 同 源 性 指出 ,它们 来 源 于 非常 近期 的 基因 重复 。 因 为 新 世 
界 猴 只 有 一 个 X- 连 锁 的 色素 基因 ,而 古 世 界 猴 和 人 则 有 2 个 或 多 个 色素 基因 ,所 以 可 以 假定 ,重复 发 
AERA 3500 一 4000 万 年 以 前 \ 古 世界 猴 与 新 世界 猴 分 岐 以 后 的 祖先 中 。 作 为 该 重复 的 结果 ,人 、 猿 
和 十 世界 猴 能 分 辨 3 种 颜色 ( 即 它们 是 三 色 性 的 ) ,而 新 世界 猴 , 如 松鼠 猴 , 则 只 能 对 蓝 与 绿 或 蓝 与 红 
加 以 区 别 ,但 不 能 对 绿 与 红 加 以 区 别 ( 即 它们 是 二 色 性 的 )。 

有 趣 的 是 ,两 个 X- 连 锁 的 等 位 基因 呈 杂 合 状 态 的 雌性 松鼠 猴 是 三 色 性 的 (Jacobs 和 Neitz,1986) 。 
另 一 方面 ,只 携带 一 条 X 染色 体 的 雄 体 则 从 未 获得 过 三 色 性 视觉 。 于 是 ,在 人 和 古 世 界 猴 的 场合 ,三 
色 性 视觉 是 通过 类 似 于 同 功 酶 的 机 制 ( 即 ,两 个 有 区 别 的 蛋白 质 由 不 同 的 基因 座位 编码 ) 而 获得 的 ,而 
杂 合 体 峻 性 松鼠 猴 达到 同样 目的 , 则 是 通过 应 用 两 种 异型 酶 ( 即 , 同 一 基因 座位 上 两 个 不 同 的 等 位 基 
因 形 式 ) 来 实现 的 (图 6 一 5)。 如 果 三 色 性 视觉 能 给 予 其 携带 者 以 选择 优势 ,那么 ,新 世界 猴 的 一 基因 
座位 上 的 两 个 色 敏 感 等 位 基因 的 长 期 维持 ,可 能 是 通过 一 种 超 显 性 选择 形式 来 实现 的 (第 二 章 )。 


6.5 重复 基因 的 无 功能 化 


多余 的 重复 基因 更 可 能 是 变 成 无 功能 基因 、 而 不 是 进化 成 一 个 新 基因 ,因为 有 害 突变 远 比 有 利 突 
变 发 生得 频繁 。 一 个 重复 基因 的 无 功能 化 即 产生 一 个 假 基因 。 这 样 产生 的 假 基因 称 未 加 工 的 (unpro- 
cessed) 假 基因 ,这 与 将 在 第 七 章 中 讨论 的 经 过 加 工 的 假 基因 相反 。 表 6 一 3 列 出 了 在 几 种 珠 蛋 白 假 基 
因 中 发 现 的 结构 缺陷 .这些 未 加 工 的 假 基因 大 多 数 含有 多 重 缺 陷 , 象 阅读 框架 移动 成熟 终止 前 终止、 
和 拼接 位 点 或 调控 位 点 的 删除 等 ,以 至 很 难看 出 哪 种 突变 是 使 基因 沉默 的 直接 原因 。 在 有 几 个 例子 
里 ,也 许 能 找到 “元 凶 ”。 例 如 ,人 的 由 只 含有 一 个 严重 缺陷 ,无 义 突变 ,所 以 它 可 能 是 无 功能 化 的 直接 
原因 。 (符号 小 用 来 将 假 基因 与 其 有 功能 的 对 应 物 加 以 区 别 .) 有 些 假 基因 , 象 在 山羊 B 一 珠 蛋 白 多 基 
因 家 族 中 的 PB 和 灿 ', 则 是 由 一 个 预先 存在 的 假 基因 重复 而 得 来 的 。 
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X 染色 体 BREE 视觉 


————= een ////////// 1/71 sam a 
gx ——=—= 一 zz 三 名 性 
人 —=—_ -一 CA 一 三 色 性 
{LLL 
一 [一 -一 CT 一 局 
9 新 世界 猴 纯 合 子 上 aa 二 色 性 
or 
a -一 CT 一 二 色 性 
一 LLIB 
— 一 DZ 一 bs 
9 新 世界 猴 杂 合子 ae zz 
—___+— 一 CA 克 一 = 
Ga 新 世界 猴 一 色 性 
or 
一 一 二 二 ES 一 一 2ZZZZDZ 罗 一 
ZL 二 色 性 


图 6 一 5 人 和 新 世界 猴 (NWM) 的 雄性 和 雌性 中 ,三 色 性 视觉 的 分 子 基础 。 注 意 , 雄 性 新 世界 猴 不 能 获得 三 色 性 视 
觉 。 涂 黑 了 的 、 空 心 的 和 画 斜 线 的 矩形 分 别 表示 绿 、 红 和 蓝 色 素 基 因 。 
表 6 一 3 珠 蛋 和 白 假 基因 中 的 缺陷 ” 


阅读 框架 MAKI REG 拼接 GT/ 改变 了 的 终 SRR Ma 


假 基因 TATA 起 始 密码 子 
移动 前 终止 AER AGM 止 密码 子 ”号 AATAAA 


人 gal 十 十 十 十 十 十 十 
A 9 + 

小 鼠 a3 十 在 十 十 

小 鼠 pad + - 

小 山 ph3 ? "4 + oF + + ? 

we ge + + + + + + + 
山羊 op" 二 十 十 十 十 7 
免 gp2 十 十 十 十 


A Li(1983) 
a\ 加 号 表示 存在 一 种 特别 类 型 的 缺陷 ;问号 表示 有 存在 该 缺陷 的 可 能 性 。 


6.6 基因 重复 的 年 代 测 定 


两 个 基因 ,如 果 它 们 是 从 一 次 重复 事件 中 得 来 的 则 称 为 平行 相关 的 (paralogous) ,如 果 它 们 是 从 
一 次 物种 形成 事件 中 得 来 的 则 称 为 垂直 相关 的 (orthologous) 。 例 如 在 图 6 一 6 中 ,基因 ao 和 有 B 是 从 一 个 
祖先 基因 的 重复 中 得 到 的 ,因而 是 平行 相关 的 ,而 来 自 物种 1 的 基因 MRA WH 2 的 基因 w 则 是 垂 
. 直 相 关 的 ,来 自 物 种 1 的 B 基 因 和 来 自 物 种 2 的 B 基 因 间 的 关系 也 是 如 此 。 

如 果 我 们 知道 基因 c 和 基因 有 B 中 的 替换 速率 , 则 我 们 即 可 从 序列 资料 中 估 出 重复 的 年 代 , 即 To. 
而 替换 速率 则 可 根据 垂直 相关 的 基因 间 的 替换 数 ,结合 有 关 物 种 1 和 物种 2 间 分 岐 时 间 Ts 的 知识 
(图 6 一 6) 来 佑 出 。 下 面 我 们 将 说 明 Tp 的 估 值 是 怎样 得 到 的 。 
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图 6 一 6 用 来 估计 一 个 基因 重复 事件 的 时 间 (Tp) 的 模型 。a 和 有 B 这 两 个 基因 来 自 Tp 单位 时 间 以 前 一 个 祖先 物种 

中 发 生 的 重复 事件 。 后 来 该 物种 分 裂 成 两 个 物种 ,1 和 2, 这 发生 在 Ts 时 间 单 位 以 前 。 在 物种 1 和 物种 2 中 的 两 个 

a 基 因 是 重 直 相关 的 ,两 个 B 基 因 也 是 如 此 ,但 wa 基 因 和 B 基 因 间 则 是 平行 相关 的 。 

对 于 基因 KK. 为 这 两 个 物种 间 的 每 位 点 替换 数 。 那 么 ,在 基因 ax 中 的 替换 速率 则 由 
Rik« 

TS 

来 估计 。 在 基因 有 B 中 的 替换 速率 ,rs 可 用 同样 方式 得 到 。 这 两 个 基因 的 平均 替换 速率 则 为 : 


we 


(6. 1) 


lat TR 
CSE. (6. 2) 


— 


为 了 估 出 Te, 我 们 需要 知道 基因 和 有 间 的 每 位 点 替换 数 (K。)。 这 个 数 可 从 以 下 4 个 对 子 的 比较 中 
得 到 :(1) 来 自 物种 1 的 基因 c 和 来 自 物 种 2 的 基因 8B,(2) 来 自 物 种 2 的 基因 xc 和 来 自 物 种 1 的 基因 
B, 3) 来自 物种 1 的 两 个 基因 ,(4) 来 自 物 种 2 的 两 个 基因 。 从 这 4 个 估 值 我 们 能 算出 Kot FH 
(Ke) ,进而 我 们 能 估 出 To 为 : 

Tp = <s (6. 3) 

注意 ,在 蛋白 质 编 码 基因 的 情况 下 ,分 别 用 同 义 蔡 换 数 和 非 同 义 蔡 换 数 ,我 们 能 得 到 两 个 相互 独 
立 的 To 估 值 .这 两 个 估 值 的 平均 值 也 许 能 作为 To 的 最 后 估 值 来 使 用 。 然 而 ,如 果 基 因 a 和 有 B 间 每 同 
义 位 点 的 替换 数 太 大 ,比如 说 大 于 1, 则 同 义 蔡 换 数 就 不 能 被 精确 地 估 出 ,这 样 同 义 蔡 换 也 许 不 能 提 
供 一 个 可 靠 的 Te 估 值 。 在 这 种 情况 下 ,将 只 有 非 同 义 替 换 数 得 到 应 用 。 反 之 ,如 果 这 种 平行 相关 的 基 
因 间 每 非 同 义 位 点 的 替换 数 太 小 ,那么 , 非 同 义 蔡 换 数 的 估 值 将 承受 较 大 的 取样 误差 ,在 这 种 情况 下 ， 
就 只 应 该 用 同 义 蔡 换 数 了 。 

以 上 我 们 是 在 速率 恒定 的 假定 下 进行 的 。 此 假定 可 用 以 上 提 及 的 4 个 对 子 的 比较 来 加 以 检验 。 如 
果 这 4 个 对 子 的 比较 中 近似 相等 性 不 成 立 , 则 该 假定 也 不 能 成 立 。 如 后 面 ( 见 第 95 页 ) 将 要 讨论 的 那 
样 ,起 因 于 具体 的 进化 事件 的 一 些 问题 也 可 能 会 产生 ,并 使 Te 的 估计 复杂 化 。 

测定 基因 重复 事件 年 代 的 另 一 种 方法 是 ,结合 有 关 被 研究 物种 分 岐 年 代 的 古生物 学 资料 ,来 考虑 
基因 在 系统 发 育 中 的 分 布 。 例 如 , 除 无 颌 鱼 (Agnatha) 外 所 有 兰 椎 动物 都 编码 c 和 8B 珠 蛋白 链 . 对 此 观 
察 到 的 事件 有 两 种 可 能 的 解释 。 一 种 是 :产生 w 和 有 B 珠 蛋白 的 重复 事件 发 生 在 无 颌 类 与 其 他 背 椎 动物 
的 共同 祖先 中 ,但 后 来 所 有 无 颌 类 都 丢失 了 其 中 的 一 个 重复 。 这 是 有 可 能 的 但 可 能 性 不 大 ,因为 这 样 
一 种 设想 需要 在 许多 进化 谱系 中 发 生 的 这 种 丢失 是 非 独 立 的 ( 即 与 物种 有 关 )。 另 一 种 解释 是 :重复 事 
件 发 生 在 无 癸 类 与 其 他 所 有 兰 椎 动物 的 祖先 分 岐 之 后 ,但 在 其 他 背 椎 动物 幅 射 演化 之 前 (4. 5 一 5 亿 
年 前 )。 后 一 种 解释 想来 要 更 合理 一 些 , 所 以 重复 的 年 代 普 遍 取 4.5 一 5 亿 年 前 (Dayhoff ,1972;Dicker- 
son 和 Gels,1983) 。 

显然 ,以 上 方法 只 能 粗略 给 我 们 提供 重复 年 代 的 估 值 ,所 以 ,对 所 有 佑 值 都 应 该 小 心 采 用 。 
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珠 蛋 白 超 家 族 曾经 历 过 所 有 可 能 发 生 在 重复 顺序 家 族 中 的 进化 路 线 :(1) 原 始 功能 的 保留 ,(2) 新 
功能 的 获得 ,和 (3) 某 些 重复 中 功能 的 丧失 。 对 人 类 而 言 , 珠 蛋白 超 家 族 由 3 个 家 族 构 成 : 肌 红 蛋白 家 
族 , 它 的 唯一 的 一 个 成 员 位 于 第 22 染色 体 上 ,位 于 第 16 染色 体 上 的 一 珠 蛋 白 家 族 , 和 位 于 第 11 H 


染色 体 16 ‘a WO wa2 al a2 al 61 
RA 11 
€ Cry a UB 8 B 


染色 体 22 肌 红 蛋 日 
一 
图 6 7 人 的 珠 蛋 白 基因 起家 族 的 3 个 基因 家 族 的 染色 体 排 列 :w… 珠 蛋白 家 族 在 第 16 染色 体 上 ,B 一 珠 蛋 自家 族 
在 第 11 染色 体 上 ,而 肌 红 蛋 白 则 在 第 22 染色 体 上 。 涂 黑 了 的 矩形 块 表 示 有 功能 的 基因 ,空心 短 形 块 则 表示 假 基 
A. 
色 体 上 的 8 一 珠 蛋 白 家 族 (图 6 一 7)。 这 3 个 家 族 合 在 一 起 产生 两 种 功能 蛋白 质 : 肌 红 和 蛋白 和 血红 蛋 
白 。 这 两 种 蛋白 质 在 约 6 一 8 亿 年 前 发 生 分 岐 ( 见 图 6 一 8;Dayhoff,1972;Doolittle,1987) ,并 已 经 在 某 
些 方面 发 生 了 特 化 。 从 组 织 特异 性 角度 看 , 肌 红 蛋白 变 成 了 肌肉 中 的 储 氧 蛋白 质 ,而 血红 蛋白 则 变 成 


了 血液 中 氧 的 运输 员 。 就 四 级 结构 而 言 , 肌 红 蛋白 保留 着 单 体 性 结构 ,而 血红 蛋白 则 变 成 了 四 聚 体 . 从 - 


功能 上 看 , 肌 红 和 蛋白 已 进化 为 有 比 血红 蛋白 更 高 的 氧 亲 合力 ,而 血红 蛋白 的 功能 则 变 得 更 加 精密 而 可 
Wal CW Stryer,1988) 。 例 如 ,哺乳 类 的 血红 蛋白 ,有 根据 血液 中 有 机 磷酸 盐 的 水 平 来 调节 其 对 氧 的 亲 
合 性 的 能 力 。 显 然 , 异 源 多 聚 体 结构 有 助 于 血红 蛋白 功能 的 精密 化 。 

人 和 绝 大 多 数 冰 椎 动物 的 血红 蛋白 是 由 两 种 链 所 构成 ,一 种 由 w 家 族 的 成 员 编码 , 另 一 种 则 由 B 
家 族 的 成 员 编 码 .如 以 上 所 讨论 的 ,ac 家 族 和 B 家 族 是 在 约 4.5 一 5 亿 年 前 发 生 分 岐 的 (图 6 一 8) 。 由 于 
无 售 鱼 只 具有 一 种 单 体 的 血红 蛋白 ,所 以 , 肴 椎 动物 血红 蛋白 的 多 聚 体 化 一 定 是 在 靠近 a 一 B 分 岐 的 
时 刻 出 现 的 。 

在 人 类 中 ,ax 家族 由 4 个 功能 基因 , 即 5,aw .os 和 最 近 发 现 的 61 所 构成 (图 6 一 7) 。 它 还 含有 3 不 
EA: $C. pol 和 ya2。B 家 族 由 5 个 功能 基因 : 即 E ,sy;,Ay,B 和 ,以 及 一 个 假 基因 $B Fr Zh. XA 
上 家 族 已 经 在 生理 学 特性 和 个 体 发 育 调节 等 两 个 方面 都 发 生 了 分 岐 .事实 上 ERM RERMALA 
不 同 的 珠 蛋 白 出 现 ;胚胎 期 为 上 E， 和 wwE，, 胎 儿 期 为 wy ,而 在 成 年 期 则 为 apB 和 a5, ;01 在 何 时 表 
达 尚 且 不 知 。 而且, 与 氧 结合 的 亲 合 性 方面 的 差别 ,也 在 这 些 珠 蛋白 中 发 生 了 进化 。 例 如 ,胎儿 在 红 翟 
白 xy 有 比 任何 一 种 成 人 血红 蛋白 (wpB 和 2) 都 高 的 氧 亲人 合力, 因而 能 在 处 于 相对 缺 氧 ( 低 氧 ) 环 
境 的 胎儿 中 更 好 地 行使 功能 (Wood 等 ,1977)。 这 一 现象 再 次 为 这 样 一 个 事实 作出 了 例证 , 即 基因 重 
复 能 导 至 生理 系统 精细 化 的 结果 。 

在 % 家族 的 成 员 中 ,胚胎 型 5 是 分 岐 程度 最 高 的 ,在 3 亿 多 年 以 前 就 已 经 分 枝 了 (图 6— 8) Pl 珠 
HAE RY 2. 6 (C46 Bi RAE PE EPPS oo SRE i) A Sk Bo VG AR ES GK a To, 
基因 。w 基因 和 基因 有 几乎 等 同 的 DNA 顺序 , 且 产 生 同 样 的 多 肽 。 看 起 来 这 好 象 表示 它们 的 分 岐 
时 间 离 现在 非常 近 。 然而 ,这 种 类 似 性 也 可 能 是 协同 进化 的 结果 (Zimmer 等 ,1980) ,这 一 现象 我 们 放 
在 后 面 讨论 ( 见 第 101-102 页 )。 这 两 个 基因 存在 于 人 类 和 所 有 狼 类 中 ,所 以 可 能 是 在 2000 多 万 年 以 
前 产生 的 。 

在 8 家族 的 成 员 中 ,成 年 型 (8 和 8) 与 非 成 年 型 (y ME DAME 1. 55 一 2 亿 年 前 分 岐 (Efstratiadis 


等 ,1980) 。 两 个 7Y 基因 的 祖先 大 约 在 1 一 1.14 1Z.4F VA Bil 45 © SE PAP we PAE Y BAY 的 重复 在 大 约 3500 - 


万 年 前 ,大 谱系 与 新 世界 猴 谱系 分 开 之 后 出 现 (Shen 等 ,1981)。8 基因 和 基因 间 的 分 岐 以 前 估计 是 
. 92 « 
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图 6 一 8 人 的 珠 蛋 白 基 因 的 进化 史 . 虚线 表示 一 个 假 基因 谱系 。 图 中 只 标 出 了 两 个 G 一 珠 蛋白 基因 中 的 一 个 ,因为 
它们 相互 间 发 生 分 岐 的 年 代 还 未 确定 : - 
在 4000 万 年 前 (Dayhoff ,1972;Efstratiadis 等 ,1980) ,但 最 近 DNA 顺序 资料 表明 , 它 可 能 早 于 真 兽 类 
的 辐射 , 即 在 约 8000 万 年 前 出 现 (Hardison 和 Margot,1984;Goodman 等 ,1984)。 从 以 上 讨论 中 我 们 
注意 到 ,在 两 个 家 族 中 ,基因 间 分 岐 时 间 与 基因 间 功 能 或 调节 方面 的 分 岐 程度 之 间 ,存在 着 明显 的 相 
Bt 
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有 两 类 外 显 子 混 匀 (exon shuffling) :外 显 子 重复 和 外 显 子 搬入。 外 显 子 重复 指 一 个 基因 中 的 一 个 
或 多 个 外 显 子 的 重复 ,所 以 它 是 一 种 内 部 重复 ,这 已 在 基因 的 延伸 一 节 中 讨论 过 ( 见 第 81 页 )。 外 显 子 
反 入 是 这 样 一 种 过 程 ,通过 该 过 程 结 构 域 或 功能 域 在 蛋白 质 之 间 发 生 交换 ,或 者 被 插 人 一 个 蛋白 质 之 
中 。 这 两 类 混 匀 都 曾 在 产生 新 基因 的 进化 过 程 中 被 采用 。 这 里 ,我们 将 讨论 一 个 外 显 子 从 一 个 基 因 
插 人 另 一 个 基因 ,结果 产生 镶 府 或 嵌 合 蛋白 质 的 情况 (Doolittle,1985;Patthy,1985) 。 


Rik SAR 


第 一 个 被 发 现 的 灸 谋 蛋 白质 是 组 织 血 纤 蛋 白 溶 酶 原 活 化 因子 (TPA)( 图 6 一 9)。 血 纤 蛋 白 溶 酶 原 
经 TPA 作用 转化 成 它 的 活化 形式 : 血 纤 蛋白 溶 酶 ,后 者 则 将 血 纤 蛋白 、. 血块 中 的 一 种 可 溶性 的 纤维 
状 蛋 白质 溶解 。 在 底 物 血 纤 蛋白 的 存在 下 , 血 纤 蛋白 溶 酶 原 转化 成 血 纤 蛋 白 溶 酶 的 过 程 将 被 大 大 加 
速 。 血 纤 蛋 白 能 与 血 纤 蛋 白 溶 酶 原 和 TPA 两 者 结合 ,从 而 将 它们 联系 起 来 而 起 催化 作用 。 这 种 分 子 
排列 方式 允许 血 纤 蛋白 溶 酶 仅 以 非常 接近 血 纤 蛋白 的 形式 产生 ,从 而 给 予 血 纤 蛋 白 溶 酶 原 以 对 血 纤 
蛋白 的 特异 性 。 相 比 之 下 , 尿 激 酶 (UK) ,一 种 尿 液 中 的 血 纤 蛋 白 溶 酶 原 活化 因子 , 则 缺乏 血 纤 蛋 白 特 
异性 。 对 TPA 和 UK 的 前 体 尿 激 酶 原 的 氨基 酸 顺 序 比 较 表 明 ,TPA 在 其 氨基 末端 含有 43 个 残 基 序 
Fi, im UK 中 却 没有 相应 的 对 应 物 (Banyai 等 ,1983) 。 这 一 片段 能 形成 一 种 手指 样 结构 (图 6 一 9a) ,而 
它 和 另 一 种 蛋白 质 的 与 血 纤 蛋白 亲 合 性 有 关 的 指 状 域 是 同 源 的 。 后 一 种 蛋白 质 是 一 种 存在 于 血浆 中 
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EGFP 
图 6 一 9 (a) 组 织 血 纤 蛋白 溶 酶 原 活 化 因子 (TPA) 与 其 他 涉及 血液 凝结 和 血 纤 蛋白 溶解 的 蛋白 质 中 观察 到 的 各 种 
结构 组 件 。 方 框 插图 显示 了 非 蛋 白 酶 区 域 中 组 件 的 结构 : 氏 , 纽 结 杆 状 组 件 ;G, 生 长 因子 组 件 ; 下 , 指 状 组 件 ;C RR 
RAK 的 钙 结 合 组 件 。 画 有 斜 线 的 杆 状 图 形 表 示 与 胰 有 蛋白 酶 同 源 的 蛋白 酶 区 域 。 自 Patthy(1985) 修 改 而 成 。 
(b) 通 过 外 显 子 插入 组 织 血 纤 蛋 白 溶 酶 原 活化 因子 (TPA) 和 有 蛋白质 而 获得 的 组 件 的 起 源 。pPUK , 尿 激 酶 原 ,EGFP, 表 
皮 生 长 因子 前 体 ;FN , 纤 粘 连 有 蛋白 (fibronectin ) 。 
或 细胞 表面 上 的 起 促进 细胞 粘着 作用 的 大 分 子 糖 蛋白 称 纤 粘 连 和 蛋白 (EN)( 图 6 一 9b)。 若 指 状 域 片 
段 缺 失 会 导 至 TPA 的 血 纤 蛋白 亲 合 性 丧失 。TPA 与 EN 的 同 源 性 限制 在 这 种 指 状 域内 。 所 以 ,外 显 
子 混 匀 必定 是 与 TPA M FN 或 某 一 类 似 蛋 白质 那里 获得 该 域 的 事件 有 关 的 。 

TPA 还 含有 一 个 与 表皮 生长 因子 (EGF) 和 另 一 些 蛋 白质 的 类 生长 因子 区 域 同 源 的 片段 。 另 一 些 
蛋白 质 是 指 象 因子 KK 和 因子 X 之 类 的 蛋白 质 , 它 们 是 在 血液 凝结 过 程 中 促使 血液 结 块 的 酶 。 此 外 ， 
TPA 的 羧基 端 区 域 与 胰 蛋 白 酶 和 其 他 胰 和 蛋白酶 样 的 丝氨酸 蛋白 酶 的 酶 蛋白 部 分 同 源 ,这 些 酶 都 起 着 
将 蛋白 质 水 解 成 多 肽 片段 的 作用 。 最 后 ,TPA 的 非 酶 蛋白 部 分 含有 两 个 类 似 于 血 纤 蛋白 溶 酶 原 的 纽 
结 杆 (Kringle) 的 结构 。( 一 个 纽 结 杆 是 一 个 富 含 半 胱 氨 酸 的 序列 ,序列 中 含有 3 个 内 部 二 硫 桥 并 形成 
一 种 有 点 象 丹 麦 蛋 糕 的 纽 结 杆 状 结构 ,这 种 丹麦 蛋糕 的 名 字 是 (Kringle)。 所 以 ,在 TPA 的 进化 期 间 ， 
它 至 少 从 其 他 3 个 基因 : 血 纤 蛋白 溶 酶 原 , 表 皮 生 长 因子 和 纤 粘 连 蛋 白 那里 ,夺取 了 至 少 4 个 DNA 
片段 (图 6 一 9b)。 而 且 , 这 些 得 来 的 单位 的 连结 处 和 外 显 子 与 内 含 子 间 的 边界 精确 地 一 致 ,于 是 ,就 使 
得 关于 外 显 子 事实 上 曾 从 一 个 基因 转移 到 另 一 个 基因 的 想法 更 加 可 信 。 有 关外 显 子 混 匀 的 更 多 例子 ， 
可 见 Doolittle(1985) 和 Patthy(1985) 。 


外 显 子 混 匀 上 的 相位 限制 


为 了 使 一 个 插入 某 一 基因 的 内 含 子 中 的 外 显 子 不 至 于 引起 阅读 框 如 上 的 框架 移动 ,接受 基因 时 
的 相位 限制 就 必须 遵守 。 为 了 把 这 种 限制 搞 清楚 ,让 我 们 根据 内 含 子 相对 于 编码 区 的 可 能 位 置 来 将 
内 合子 归于 不 同 的 类 型 。 位 于 两 编码 区 之 间 的 内 含 子 , 根 据 编码 区 被 打 断 的 方式 可 被 分 成 3 种 类 型 。 


WAAR SEAS HES Zi MERA AM 0 的 内 含 子 ; 如 果 它 位 于 一 个 密码 子 的 第 1 和 第 2 


TERR MERAH I 1; 如 果 它 位 于 一 个 密码 子 的 第 2 和 第 3 个 核 苷 酸 之 间 , 则 它 具 有 相位 2 
e。 94。 


人 外 显 子 类 型 


相位 0 相位 0 ay 


(c) 3 om 1 2 * 3 
相位 0 相位 2 区 


图 6 一 10 ASH AFH LF HK 。 外 显 子 用 和 矩形 块 表 示 。 外 显 子 一 内 含 子 连结 处 上 的 数字 指示 外 显 子 的 最 
后 一 个 核 苦 酸 的 密码 子 位 置 ,内 含 子 一 外 显 子 连结 处 上 的 数字 则 指示 外 显 子 的 第 一 个 核 音 酸 的 密码 子 位 置 .9 种 可 
能 的 外 显 子 类 型 中 只 有 3 种 在 图 中 表示 出 来 了 。 


”，(b) 1 


(c) 1 3 


图 6 一 11 HktFMAASTHER. BHR ERE RI TMRER BA. (a)—Ph0-1 不 对 称 外 显 子 插入 一 
个 相位 一 0 内 含 子 ;(b) 一 个 0 一 0 对 称 外 显 子 插 入 一 个 相位 一 1 内 含 子 ;(c) 一 个 0 一 0 对 称 外 显 子 插入 一 个 相位 一 
0 内 含 子 。(a) 和 (b) 中 的 插入 为 不 成 功 的 插入 。 
〈 图 6 一 10)。 外 显 子 则 根据 其 两 侧 的 内 含 子 而 组 合 归 类 。 例 如 ,图 6 一 10b 中 处 在 中 间 的 外 显 子 ,其 5 
端 与 相位 一 0 内 含 子 相 邻 , 其 3' 端 与 相位 一 1 内 含 子 相 邻 ,因而 说 它 是 0 一 1 类 型 。 两 端 由 同样 相位 的 
内 含 子 包 围 的 外 显 子 称 为 对 称 的 外 显 子 (symmetrical exon) ,否则 即 为 非 对 称 的 (asymmetrical) 。 例 
如 ,图 6 一 10a 中 处 在 中 间 的 外 显 子 是 对 称 的 。 在 9 种 可 能 的 外 显 子 类 型 中 ,3 种 是 对 称 的 (0 一 0,1 一 1 
和 2 一 2),6 种 是 非 对 称 的 。 

只 有 对 称 的 外 显 子 才能 被 插 和 人 内 含 子 中 。 例如 ,图 6 一 11a 中 ,一 个 0 一 1 外 显 子 插入 一 个 相位 一 0 
内 含 子 ,结果 造成 后 面 所 有 外 显 子 的 阅读 框架 移动 。 而 且 , 对 称 外 显 子 的 插 人 也 是 有 限制 的 ;一 个 0 一 
0 外 显 子 只 能 插入 相位 为 0 的 内 含 子 ,类 似 地 ,一 个 1 一 1 外 显 子 只 能 插 和 人 相位 为 1 的 内 含 子 ,一 个 2 
一 2 外 显 子 也 只 能 插 和 人 相位 为 2 的 内 含 子 , 以 图 6 一 llb 的 情况 为 例 , 一 个 0 一 0 外 显 子 插入 了 一 个 相 
位 为 1 的 内 含 子 ,结果 造成 被 插入 外 显 子 和 在 它 3' 端 侧 所 有 外 显 子 的 阅读 框架 移动 。 图 6 一 1lc 则 显 
示 ,一 个 0 一 0 外 显 子 插 入 一 个 相位 为 0 的 内 含 子 之 中 将 不 会 引起 阅读 框架 移动 。 


6.9 产生 新 功能 的 变通 途径 


除了 基因 重复 和 外 显 子 混 匀 以 外 ,还 有 许多 别 的 产生 新 基因 或 新 多 肽 的 机 制 。 以 下 将 考虑 3 种 这 
FF AY BL iil 。 


重奏 基因 


已 经 发 现 , 一 个 DNA 片段 能 通过 用 不 同 阅读 框架 来 为 一 个 以 上 的 基因 编码 。 这 一 现象 在 病毒 、 
细胞 器 和 细菌 中 普遍 存在 。 图 6 一 12a 展示 了 一 个 单 链 DNA MP A OX174 的 遗传 图 。 其 中 已 观察 到 
LAH RA. ign 基因 也 整个 地 被 包含 在 基因 A DAME K 在 5 端 与 基因 A 重奏 ,在 3' 端 与 
基因 C 重 友 。 后 一 情况 的 更 详细 分 析 于 图 6 一 12b 给 出 。 

2 个 DNA 序列 的 两 条 互补 链 而 产生 。 wi iu. 人 线粒体 基因 组 中 ,确定 tR- 
NA 和 tRNAcn 的 基因 分 别 位 于 不 同 的 链 上 ,并 且 它 们 之 间 有 一 个 3 一 核 昔 酸 重 到 ,前 者 中 读 成 纪 一 
CTA 一 3' ,后 者 中 读 成 5 —TAG—3’ (Anderson 等 ,1981) 。 

间 题 是 ,在 进化 期 间 重奏 基因 可 能 是 怎样 产生 的 呢 ? 为 了 回答 这 一 问题 ,我 们 注意 到 ,开放 阅读 杠 
架 在 整个 基因 组 中 大 量 存在 .因此 ,相当 长 度 的 潜在 编码 区 存在 于 已 有 基因 的 不 同 阅读 框架 中 或 互补 
链 上 ,这 是 完全 可 能 的 。 因 为 64 种 可 能 的 密码 子 中 只 有 3 种 是 终止 密码 子 , 所 以 ,即使 一 个 随机 的 
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图 6 一 12 OX174 噬菌体 单 链 环 状 DNA 图 。 注 意 , 为 B 蛋 白质 编码 的 基因 (黑色 ) 被 完全 包含 在 为 A 有 蛋白质 编 码 的 
基因 内 ,而 基因 开 则 与 两 个 基因 A 和 C 重 登 。 自 Kornberg(1982) 修 改 而 成 。(b) 显 示 出 与 基因 A 的 5 部 分 和 基因 
CHS 部 分 重 三 的 K 基因 的 顺序 。 星 号 表示 终止 密码 子 。( 关 于 氨基 酸 的 单字 母 缩写 见 表 1 一 1)。 


。96 。 


DNA 顺序 也 可 能 含有 成 百 个 核 苷 酸 长 度 的 开放 阅读 框架 .如果 碰巧 这 样 一 个 阅读 框架 中 含有 一 个 起 
始 密码 子 和 一 个 转录 起 始 位 点 ,或 者 通过 突变 产生 了 这 些 位 点 ,那么 ,一 条 额外 的 mRNA 就 将 会 被 转 
录 出 来 ,并 随后 被 翻译 成 一 个 新 蛋白 质 。 这 一 新 产物 是 否 有 有 利 功能 那 就 是 另 一 回 事 了 ,但 如 果 它 确 
有 , 则 这 种 性 状 就 可 能 会 在 群体 中 固定 。 

我 们 也 注意 到 ,为 重 秋 基 因 编 码 的 DNA 区 段 上 的 进化 速率 ,预期 要 低 于 只 用 一 种 阅读 框架 的 类 
似 DNA 序列 。 其 原因 是 ,在 重 至 基因 中 非 简 并 位 点 的 比例 要 高 于 非 重 友基 因 中 的 同类 比例 ,这 就 大 
大 降低 了 同 义 突变 在 总 突变 中 的 比例 (Miyata 和 Yasunaga,1978). 


变通 性 的 拼接 


原始 RNA 转录 产物 的 变通 性 拼接 ,可 能 会 造成 从 同一 个 DNA 片段 产生 不 同 多 肽 产物 的 结果 。 
在 这 种 情况 下 ,外 显 子 和 内 含 子 间 的 界限 就 不 再 是 绝对 的 了 ,而 是 有 赖 于 所 涉及 的 mRNA。 许 多 
RNA 变通 性 加 工 的 例子 已 在 多 细胞 生物 中 被 发 现 。 

变通 性 拼接 常 被 用 作 生 长 调节 的 手段 。 在 涉及 果 蝇 D. melanogaster 的 性 别 决定 过 程 的 几 个 基因 
中 , 曾 看 到 一 种 非常 有 趣 的 情形 。 至 少 有 3 个 基因 :性 致死 基因 (Szl)、 转 化 基因 (tra) 和 倍 性 基因 
(dsz) ,在 雄性 和 峻 性 中 是 以 不 同 的 方式 进行 拼接 的 (图 6 一 13)。 在 dsrz 的 情况 中 ,该 基因 有 6 个 外 显 
F SBF 1.2.3 和 4 用 于 雌性 ,而 外 显 子 1.2.3、5 和 6 则 用 于 雄性 。 在 Sol 和 cra 的 情况 下 ,雄性 中 
变通 性 拼接 的 产物 含有 成 熟 前 终止 密码 子 , 因 而 是 无 功能 的 。 例 如 ,Szl 的 外 显 子 3 中 含有 一 个 框架 
内 的 终止 密码 子 . 但 雌性 的 mRNA 却 不 含 这 种 外 显 子 。 


HEHE 前 -mRNA 雄性 
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图 6 一 13 R# D. melanogaster #2 (A) Fo BEA) P KIRA (Sz), 转化 基因 (ira) 和 售 性 基因 (dsz) 的 拼 
接 模 式 。“ 人 停止? 指示 一 个 终止 密码 子 , 它 截断 成 误 mRNA 的 编码 区 ,从 而 造成 产物 无 功能 。 自 Baker(1989) 。 

变通 性 拼接 的 一 个 特例 可 用 由 内 含 子 编码 的 蛋白 质 的 例子 来 加 以 说 明 (Perlman 和 Butow， 
1989) 。 在 这 类 例子 中 ,该 内 含 子 含 有 一 个 开放 阅读 框架 , 它 为 功能 完全 不 同 于 其 两 侧 外 显 子 所 编码 的 
蛋 自 质 的 某 种 蛋白 质 全 部 或 其 一 部 分 编码 .在 有 些 情 况 下 ,这 类 开放 阅读 框架 是 其 上 游 外 显 子 的 延伸 
物 ,例如 ,酵母 线粒体 基因 cor | 中 的 内 含 子 al4a( 图 6 一 14a) 。 在 另 一 些 情况 下 ,内 含 子 不 仅 包 括 一 个 
游离 态 的 编码 蛋白 质 的 基因 ,而且 还 含有 关于 转录 起 始 和 终止 的 必要 信和 号 (图 6 一 14b)。 内 含 子 al4a 
十 分 有 趣 ,因为 它 为 一 种 被 称 为 成 熟 酶 的 酶 蛋白 编码 。 成 熟 酶 对 这 个 内 含 子 从 它 的 前 体 mRNA 上 准 
确 地 自我 拼接 去 除 是 必要 的 。 这 种 成 熟 酶 在 DNA 重组 中 还 起 着 内 切 核酸 酶 的 作用 。 

要 出 现 变通 性 拼接 的 进化 ,就 需要 重新 产生 一 个 变通 性 拼接 的 联结 位 点 。 因 为 拼接 信和 号 通常 长 为 
5 一 10 个 核 苷 酸 ,所 以 通过 突变 这 类 位 点 以 一 种 可 以 查 觉 的 频率 产生 是 有 可 能 的 。 事 实 上 ,从 文献 中 
知道 已 有 许多 这 样 的 例子 。 例 如 ,图 6 一 15 所 示 的 例子 中 ,甘氨酸 密码 子 中 的 一 次 同 义 蔡 换 即 把 茶 一 
编码 区 变 成 了 拼接 部 位 。 在 图 6 一 15 关于 有 和 #- 地 中 海 贫血 症 的 病理 学 查证 的 例子 中 ,新 的 拼接 位 点 通 
常 比 老 的 拼接 位 点 更 强 ( 即 ,该 突变 发 生 后 合成 的 mRNA 大 多 数 为 已 发 生 改 变 的 那 种 类 型 )。 这 样 的 
突变 显然 具有 有 害 的 后 果 ,预期 绝 不 会 在 群体 中 固定 。 然 而 ,如 果 新 产生 的 拼接 位 点 要 弱 得 多 , 则 大 多 
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图 6 一 14 内 含 子 为 蛋白 质 编码 的 例子 :(a) 一 个 开放 阅读 框架 ( 画 有 斜 条 纹 ), 它 是 上 游 外 显 子 (空心 矩形 块 ) 的 一 
个 延伸 物 (例如 , 酶 母线 粒 体 基因 cor 工 中 的 内 含 子 al4a);(b) 一 个 游离 存在 的 开放 阅读 框架 ,其 转录 起 始 和 终止 
信号 位 于 内 含 子 之 中 (例如 ,噬菌体 T4 P sumY RAHAST). KARA Perlman 和 Butow(1989) 。 


CaccTGact 寻常 应 有 的 拼接 


CAGGTTGGT 


时 GIT GGT GGT GAG, GEG, GTC .G6C, AG. cTcen 
B- 珠 蛋白 基因 Wes) 


Val Gly Gly Glu Ala Leu Gly Arg 
ASF 
B+ -地 中 海 贫 血 症 基因 GTT GGA GGT GAG GCC GTG GGC AG GTTGGT 
人 


GAGGTGAGG 


@eeoeoeoe ee 
寻常 应 有 的 拼接 = RAGGTRACT  、 
图 6 一 15 来 自 正 常 个 体 和 吉日 -地 中 海 贫血 症 的 病人 的 8- 珠 蛋 白 基 因 中 ,外 显 子 1 和 内 含 子 工 间 区 域 的 核 昔 酸 
顺序 。 发 生 了 突变 的 核 昔 酸 以 黑体 字 表 示 。 箭 头 指示 拼接 位 点 。 每 个 拼接 部 位 都 与 寻常 应 有 的 拼接 部 位 进行 顺序 
比较 , 园 点 表示 这 些 拼接 部 位 与 寻常 应 有 的 拼接 部 位 间 有 相同 的 核 苦 酸 。 
数 mRNA 将 是 原始 类 型 , 上 且 只 有 少量 的 新 型 mRNA 产生 出 来 。 这 样 的 改变 将 不 会 抹杀 旧 功 能 ,也 为 
产生 一 种 具有 新 功能 的 有 用 的 蛋白 质 创 造 了 一 个 机 会 。 


基因 分 享 


从 产生 新 功能 的 观点 看 , 当 一 个 基因 产物 不 作 任何 氨基 酸 顺 序 方面 的 改变 而 用 来 行使 另外 的 功 
能 时 ,一 种 令 人 极 感 兴趣 的 情形 就 出 现 了 。 这 一 现象 曾 被 命名 为 "基因 分 享 ”"( "gene sharing”) (Piatig- 
orsky 等 ,1988)。 基 因 分 享 的 意思 是 ,一 个 基因 在 没有 重复 也 没有 失去 原始 功能 的 情况 下 获得 了 并 保 
持 着 第 二 种 功能 .不 过 ,基因 分 享 可 能 会 要 求 在 组 织 特异 性 或 发 育 时 序 性 的 调节 系统 方面 发 生 一 点 变 
化 。 
基因 分 享 最 初 在 晶状体 中 发 现 , 这 里 晶状体 是 构成 眼睛 的 水 晶体 赖 以 维持 透明 和 适当 的 光线 折 
射 的 物质 。 最 初 的 发 现 是 ,来 自 乌 类 和 鲍 类 的 皇 晶 状 体 在 氨基 酸 顺 序 上 与 乳酸 盐 脱 氢 酶 BILLDH 一 B4， 
见 第 84 页 ) 等 同 ,上 且 具 有 同样 的 LDH 活性 (Wistow 等 ,1987) 。 后 来 的 工作 表明 ,这 “两 种 ”蛋白 质 事实 
上 是 同一 种 蛋白 质 , 而 且 是 由 同样 的 基因 来 编码 的 (Hendriks 等 ,1988)。 第 二 种 晶状体 8 存在 于 所 有 
鸟 类 和 疏 行 类 之 中 ,也 已 被 证 明 在 顺序 方面 与 另 一 种 酶 等 同 。 这 种 酶 即 精 氨 琥 珀 酸 裂解 酶 , 它 催化 将 
精 氨 焉 珀 酸 转 化 成 精 氨 酸 的 反应 。 这 两 个 蛋白 质 好 象 也 是 由 同样 的 基因 编码 的 (Piatigorsky 等 ， 
1988) 。 类 似 地 ,七 鳃 鳗 , 真 骨 鱼 类 , 疏 行 类 和 鸟 类 中 的 r 一 晶状体 ,已 被 证 明 与 "一 烯 醇 酶 等 同 并 由 同 
样 的 基因 编码 。co 一 烯 醇 酶 是 糖 酵 解 中 的 一 种 酶 ,将 2 一 磷酸 甘油 酸 转化 成 磷酸 烯 醇 式 丙酮 酸 (Piatig- 
orsky 和 Wistow,1989)。 于 是 ,3 一 、 插 一 和 一 晶状体 的 例子 说 明 ,一 个 未 经 重复 的 基因 能 通过 基因 
分 享 而 获得 额外 的 功能 。 另 一 方面 ,ac.8 和 7 晶状体 则 是 另 一 类 蛋白质 的 经 典 例子 ,这 类 蛋白质 通过 
基因 重复 ,以 及 其 后 由 祖先 基因 分 化 成 为 不 同 蛋白 质 编码 的 基因 而 进化 (例如 , 热 震 惊 基因 ,为 暴露 于 
过 热 环 境 后 才 表 达 的 蛋白 质 编码 ) 。 
s ORs 
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基因 分 享 可 能 是 相当 普通 的 现象 。 事 实 上 ,在 以 上 例子 中 ,那些 酶 和 晶状体 自身 就 可 能 有 两 种 以 
上 的 功能 。 例 如 ,r* 一 品 状 体 /% 一 烯 醇 酶 也 能 象 一 个 热 震 惊 蛋白 质 那样 起 作用 。 显 然 基因 分 享 增添 了 基 
因 组 的 简洁 性 ,即使 在 真 核 生 物 中 简洁 性 看 来 并 没有 很 高 的 优越 性 (第 八 章 )。 还 要 注意 ,在 晶状体 基 
因 分 享 的 例子 中 ,同一 个 多 肽 既 起 着 酶 的 作用 又 有 结构 蛋白 质 的 功能 ,这 就 搅乱 了 酶 和 非 酶 、 或 结构 
和 蛋白质 之 间 的 传统 界限 。 


6. 10 多 基因 家 族 的 协同 进化 


从 十 九 世 纪 七 十 年 代 中 期 到 十 九 世纪 八 十 年 代 中 期 ,关于 DNA 重 退 火 和 DNA 杂交 的 研究 大 量 
涌现 ,目的 在 于 探 明 真 核 生物 基因 组 的 结构 和 组 织 。 这 些 研究 揭示 , 较 高 等 生物 的 基因 组 是 由 高 度 重 
复 顺序 .中 度 重复 顺序 和 单 拷贝 顺序 等 3 类 序列 所 构成 的 (第 八 章 )。 它 们 还 揭示 出 一 个 有 趣 的 进化 现 
象 , 即 :一 个 重复 顺序 家 族 的 成 员 在 一 个 物种 内 相互 间 一 般 是 非常 相似 的 ,而 来 自 不 同 物种 的 该 家 族 
的 成 员 ,即使 这 些 物种 间 亲 缘 关 系 很 近 , 相 互 间 也 可 能 是 很 不 一 样 的 。 这 一 现象 最 先 被 布 即 等 (Brown 
等 ,1972) 查 觉 ,他 们 是 在 比较 来 自 非 洲 蟾 蜂 Xenopus laevis 和 X. borealis 的 核糖 体 DNA 时 发 现 的 ,后 
— FP RB RR AB AT) BIRU AEX. mulleri, 

在 Xenopus 38 BAK BS HA HED PE 18S 和 28S 核糖 体 RNA 的 基因 以 成 百 的 拷 
贝 数 存在 着 , 且 以 一 列 或 几 个 串联 的 列 的 形式 排列 着 。 每 一 重复 单位 由 一 个 转录 片段 和 一 个 不 转录 片 
段 构成 (图 6 一 16)。 转 录 片 段 产生 一 个 45S RNA 前 体 ,该 前 体 经 酶 切割 而 被 划分 成 有 功能 的 18S 和 
28S 核糖 体 RNA。 这 种 转录 重复 片段 通过 不 转录 间隔 片段 (NTS) 而 相互 隔 开 。 

在 对 X. laevis Fl X. borealis 间 的 核糖 体 RNA 基因 的 比较 中 ,布朗 等 (Brown 等 ,1972) 发 现 ,虽然 
这 两 个 物种 的 18S 和 28S 基因 极为 相似 ,但 这 两 个 物种 间 的 NTS 区 域 却 大 不 相同 . 相 比 之 下 ,在 每 一 
个 体内 以 及 一 个 物种 的 不 同 个 体 间 .该 NTS 区 域 则 是 非常 相似 的 。 于 是 ,看 起 来 好 象 是 这 样 一 种 情 
Bi: BY NTS 区 域 在 不 同 物种 间 迅 速 分 岐 ,但 它们 在 每 一 物种 中 却 是 一 起 进化 的 .布朗 等 (Brown 等 ， 
1972) 的 结论 是 ,一 定 有 一 种 “校正 ?机 制 在 起 作用 ,以 使 某 一 突变 从 一 个 间隔 顺序 传 向 邻近 的 间隔 顺 
序 , 其 速度 快 于 在 这 些 顺序 中 出 现 新 的 变化 。 他 们 称 这 种 在 一 个 个 体内 显现 的 现象 为 水 平 进化 (hori 
zontal evolution) , 以 用 来 与 垂直 进化 相对 照 。 垂 直 进 化 是 指 某 一 突变 在 一 个 繁殖 群体 中 的 传播 . 后来， 
有 人 提出 了 并 发 进化 (coincidental evolution) 或 协同 进化 (concerted evolution) 等 等 术语 。 后 一 个 术语 
由 齐 默 尔 等 (Zimmer 等 ,1980) 提 出 ,是 目前 文献 中 最 通用 的 术语 。 
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图 6 一 16 #44 rRNA 基因 的 一 个 典型 重复 单位 的 图 解 表示 。 黑 色 杆 线 表 示 重 复 单 位 ,箭头 指示 转录 单位 。 
ETS, 外 转录 间隔 ;ITS, 内 转录 间隔 ;NTS, 不 转录 间隔 。 自 Arnheim(1983). 

随 着 限制 酶 分 析 和 DNA 顺序 测定 等 技术 的 出 现 ,已 有 大 量 资料 证 明 多 基因 家 族 中 协同 进化 的 
普遍 性 ( 见 Ohta,1980;Dover,1982;Arnheim ,1983 等 综述 ) 。 图 6 一 17 展示 了 一 个 来 自 人 和 黑猩猩 核 
糖 体 基因 的 限制 酶 分 析 的 例子 .人 类 中 ,每 一 重复 单位 在 28S 基因 3' 端 的 NTS K PA —4 Hoya | fh 
点 ， 而 在 黑猩猩 和 其 他 大 型 猿 类 中 则 缺少 这 一 位 点 。 该 瓦 pa I 位 点 很 有 可 能 是 在 人 一 猿 分 枝 之 后 而 
在 人 谱系 中 产生 的 ,并 且 最 终 在 每 一 个 人 的 重复 中 固定 了 。NTS 区 中 其 他 限制 性 位 点 也 同 祥 展 示 出 
物种 特异 的 同 源 性 。 

协同 进化 本 质 上 意味 着 ,一 个 基因 家 族 的 某 个 成 员 并 不 是 与 该 家 族 的 其 他 成 员 剖 不 相干 地 进化 
着 的 。 通 过 其 成 员 间 的 遗传 相互 作用 ,一 个 多 基因 家 族 是 以 协同 的 方式 , 象 一 个 整体 一 样 地 一 起 进化 
, 
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图 6 一 17 人 和 黑猩猩 18S 和 28S 核糖 体 基 因 中 的 限制 性 位 点 。 所 用 限制 酶 为 EcoR 1 ,Hind1 ,Puul ,Bglll ,和 
末 paI 。 基 因 上 面 标 出 的 限制 位 点 在 物种 中 是 多 态 的 。 基 因 下 面 的 那些 位 点 则 是 单 态 的 。 个 三 角形 表示 NTS 中 长 
。 度 上 的 多 态 性 。 自 Arnheim(1983) 修 改 而 成 。 


协同 进化 的 机 制 
不 等 价 交换 Cunequal crossing-over) 和 基因 转变 (gene conversion) (图 6 一 18) 近 来 被 认为 是 造成 协 
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6-18 (a) 不 等 价 交换 模型 和 (b) 基 因 转变 模型 。 不 等 价 交换 的 结果 是 ,两 条 子 染 色 体 都 出 现 了 重复 数 上 的 改变 
和 两 种 重复 类 型 (其 中 一 种 用 星 号 标 出 ) 的 频率 上 的 改变 ,后 者 是 与 亲本 频率 (50% ) 相 比较 而 言 的 。 另 一 方面 ,基因 
转变 则 仅 在 其 中 一 条 子 染 色 体 中 改变 两 类 重复 的 频率 ,而 且 对 两 条 染色 体 都 不 改变 它们 的 总 重复 数 。 自 Arnheim 
(1983) 修 改 而 成 。 
同 进化 的 两 个 最 重要 的 机 制 。 不 等 价 交换 可 以 发 生 在 生殖 细胞 减 数 分 裂 时 某 一 染色 体 的 两 条 姐妹 染 
色 单 位 体 间 ,也 可 以 发 生 在 有 丝 分 裂 时 的 两 同 源 染色 体 间 。 一 个 交互 重组 的 过 程 就 是 在 一 条 染色 单 体 
或 染色 体 中 产生 某 一 顺序 的 重复 ,而 在 另 一 条 中 则 造成 相应 的 缺失 .图 6 一 18a 展示 出 的 例子 中 ,一 次 
不 等 价 交换 事件 导 至 一 条 子 染色 体 上 出 现 3 个 重复 段 的 增幅 ,而 在 另 一 条 上 则 出 现 3 个 重复 段 的 缺 
失 。 这 种 不 等 价 交换 的 结果 是 ,两 个 子 染 色 体 都 变 得 比 它们 的 亲本 染色 体 更 为 同 源 化 。 如 果 这 种 过 程 
反复 发 生 , 则 每 种 变异 型 重复 在 染色 体 上 的 数目 将 会 随时 间 而 波动 ,最 后 将 有 一 种 类 型 会 在 该 家 族 中 
处 于 优势 . 图 6 一 19 是 一 个 假想 出 来 的 例子 ,其 中 类 型 一 4 基因 通过 反复 多 轮 的 不 等 价 交换 而 传 遍 了 
某 一 个 基因 家 族 。 不 等 价 交换 曾 用 数学 方法 详细 研究 过 ,并 且 已 取得 了 相当 程度 的 实验 支持 ( 见 O- 
hta,1980;Dover,1982;Li 等 ,1985a 等 综述 ) 。 

基因 转变 是 一 种 非 交 互 重 组 的 过 程 , 在 此 过 程 中 两 个 序列 相互 作用 的 方式 为 ,其 中 一 个 被 另 一 个 
转化 ( 见 Lewin,1990)。 从 协同 进化 过 程 的 观点 看 ,基因 转变 中 最 重要 的 类 型 是 非 等 位 基因 转变 ( 即 ， 
位 于 不 同 基因 座位 的 基因 间 的 转变 ,而 不 是 不 同 的 等 位 基因 形式 间 的 转变 )。 图 6 一 18b 是 一 个 非 等 位 
基因 转变 的 例子 ,其 中 野生 型 重复 中 有 两 个 转化 成 了 突变 型 。 结 果 ,第 一 条 子 染 色 体 变 得 比 亲 本 染色 
体 更 为 同 源 些 ,而 在 第 二 条 子 染 色 体 中 却 未 发 生变 化 。 理 论 研究 表明 ,和 不 等 价 交换 一 样 , 基 因 转 变 也 
能 产生 协同 进化 (Ohta,1984; Nagylaki, 1984) 。 基 因 转 变 曾 经 作为 7Y- 珠 蛋白 基因 (Jeffreys,1979; 
Scott 等 ,1984) 和 另外 许多 基因 中 ( 见 Dover,1982) 出 现 同 源 化 的 机 制 而 提出 来 过 。 

作为 一 种 协同 进化 的 机 制 , 基 因 转变 看 来 有 几 个 胜 过 不 等 价 交换 的 优点 。 首 先 , 不 等 价 交 换 使 一 
个 家 族 中 的 重复 基因 的 数目 发 生 改 变 , 故 而 有 时 可 能 会 造成 严重 的 份量 不 平衡 。 基 因 转 变 则 相反 ,并 
不 造成 基因 数目 改变 。 其 次 ,基因 转变 不 仅 能 对 串联 的 重复 、 而 且 能 对 分 散 的 重复 起 着 校正 机 制 的 作 - 
用 。 相 比 之 下 ,不 等 价 交换 在 所 涉及 的 重复 散布 于 非 同 源 染 色 体 上 时 就 受到 了 限制 。 如 果 这 些 重复 基 
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图 6 一 19 由 不 等 价 交换 导 至 的 协同 进化 。 不 等 价 交 换 事 件 反 复 循 环 使 得 每 一 染色 体 上 重复 基因 变 得 越 来 越 同 源 
化 。 该 过 程 还 会 影响 每 一 染色 体 上 重复 顺序 的 数目 。 自 Ohta,(1980)。 

因 位 于 染色 体 的 端 粒 部 位 (染色 体 臂 的 末端 ), 象 在 人 和 猿 的 rRNA 基因 中 的 情况 那样 ,或许 它 能 对 
非 同 源 染 色 体 起 有 效 作 用 ;而 阁 分散 的 重复 位 于 染色 体 的 中 间 , 象 在 小 鼠 的 rRNA 基因 中 的 情况 那 
样 , 则 它 将 受到 极 大 限制 (Arnheim,1983)。 如 果 这 些 重 复 散 布 在 一 条 染色 体 上 , 则 不 等 价 交换 可 能 会 
导致 重复 段 间 基因 的 缺失 或 重复 这 样 的 结果 。 例 如 ,图 6 一 20 表示 两 重复 簇 间 不 等 价 交换 的 一 个 假想 


重复 重复 


图 6 一 20 涉及 散布 重复 (空心 矩形 块 ) 的 交换 。 画 有 针 条 纹 的 憩 形 块 表示 一 个 唯一 的 基因 。 该 交换 事件 后 ,这 一 基 
因 在 一 条 染色 体 上 缺失 ,而 在 另 一 条 染色 体 上 则 重复 。 
的 例子 ,结果 是 一 条 染色 体 中 某 一 唯一 基因 的 缺 失 , 而 在 另 一 条 染色 体 中 则 相应 地 重复 。 其 中 一 条 染 
色 体 或 者 全 部 两 条 染色 体 ,可 能 会 对 携带 它们 的 生物 带 来 有 害 影 响 。 第 三 ,基因 转变 可 以 有 偏向 性 的 
方向 。 来 自 真菌 的 实验 资料 已 经 表明 ,基因 转变 方向 上 的 倾斜 是 普遍 的 、 而 且 和 常常 是 强烈 的 (Lamb 和 
Helmi, 1982) ,而 理论 研究 业已 证 明 , 轻 微 的 倾斜 就 可 能 对 重复 突变 的 固定 概率 有 很 大 影响 (Nagylaki 
和 Petes,1982;Walsh,1985) 。 
在 串 联 重复 顺序 的 大 家 族 中 ,不 等 价 交 换 可 能 象 基因 转变 一 样 是 一 个 可 接受 的 过 程 。 首 先 , 在 这 
类 家 族 中 ,重复 的 数目 显然 能 极 大 地 波动 而 不 至 引起 显著 的 逆 效 应 。 这 是 从 以 下 观察 中 得 出 的 结论 : 
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果 蝇 中 确定 RNA 的 基因 的 数目 在 同一 物种 的 不 同 个体 间 ,以 及 不 同 物种 间 变 化 幅度 大 (Ritossa 等 ， 
1966;Brown 和 Sugimoto,1973)。 在 人 类 中 ,已 发 现 几 个 串联 重复 的 家 族 , 它 们 在 拷贝 数 方面 展现 出 
异乎 寻常 的 变化 程度 (Nakamura 等 ,1987》。 其 次 ,在 一 次 基因 转变 事件 中 ,通常 只 有 一 个 小 区 域 ( 异 
源 双 链 区 ) 涉 及 ,而 在 不 等 价 交 换 中 ,染色 体 间 交换 的 重复 数 则 可 能 非常 大 。 显 然 , 交 换 的 重复 数 越 大 ， 
协同 进化 的 速率 就 越 高 (Ohta,1983)。 在 有 些 情形 下 ,不 等 价 交换 的 这 一 优点 可 大 到 足以 与 基因 转变 
的 优点 相 抗衡 。 

除 不 等 价 交 换 和 基因 转变 之 外 ,还 有 一 些 其 他 机 制 , 象 复制 滑脱 和 转 座 ( 第 一 章 和 第 七 章 ), 也 能 
造成 某 一 家 族 中 变异 型 基因 的 获得 或 丢失 (Dover,1982)。 最 后 ,应 注意 到 ,协同 进化 不 仅 要 求 突变 在 
该 家 族 成 员 间 的 水 平 转移 ( 同 源 化 ) ,而 且 要 求 突变 向 群体 中 的 所 有 个 体 传播 (固定 )。 所 以 ,我 们 还 需 
要 考虑 随机 遗传 潭 变 的 效应 。 多 费 (Dover,1982,1986) 对 在 DNA 转移 和 随机 遗传 漂 变 等 各 种 机 制 联 
合作 用 下 ,多 基因 家 族 的 协同 进化 过 程 , 起 了 一 个 名 称 , 即 分 子 驱动 (molecular drive) 。 


协同 进化 的 进化 论 含意 


协同 进化 使 得 某 一 变异 型 重复 能 传 向 所 有 基因 家 族 的 成 员 。 这 种 水 平地 传播 的 能 力 有 着 深远 的 
进化 后 果 , 因 为 这 样 一 来 ,一 个 有 利 突变 型 重复 就 能 替代 所 有 其 他 重复 而 在 该 家 族 中 固定 。 我 们 注意 
到 ,单单 一 个 变异 型 所 能 给 予 生物 的 选择 优势 通常 是 很 有 限 的 。 然 而 ,如 果 该 突变 传 给 了 许多 甚至 所 
有 成 员 的 话 , 则 这 种 优势 就 会 大 大 地 加 强 。 于 是 ,通过 协同 进化 ,一 个 较 小 的 选择 优势 可 以 变 成 较 大 的 
选择 优势 。 在 这 方面 ,协同 进化 优 于 基因 家 族 各 个 成 员 的 独立 进化 ( 见 Arnheim, ,1983;Walsh,1985) 。 

阿 恩 海 姆 (Arnheim ,1983) 曾 对 RNA 多 聚 酶 | 的 转录 调控 信号 和 RNA 多 聚 酶 工 的 转录 调控 信 
号 的 进化 进行 过 比较 。RNA 多 聚 酶 I 只 转录 rRNA 基因 ,而 RNA 多 聚 酶 工 则 转录 所 有 为 蛋白 质 编 
码 的 基因 (第 一 章 )。RNA 多 聚 酶 I 的 转录 调控 信号 的 进化 看 来 比 RNA 多 聚 酶 工 的 该 信号 的 进化 要 
快 得 多 。 例 如 ,在 无 细胞 转录 系统 中 ,一 种 小 鼠 rRNA 克隆 不 能 在 人 的 细胞 提取 物 中 转录 ,但 来 自 差 
异 极 明显 的 物种 的 蛋白 质 编码 基因 的 克隆 却 能 够 在 异 源 系统 中 转录 (例如 ,家 短 的 基因 在 人 的 细胞 提 
取 物 中 ,和 哺乳 类 的 基因 在 酵母 的 提取 物 中 )。 阿 恩 海 姆 (Arnheim,1983) 认 为 ,在 关于 RNA SRB | 
的 转录 单位 的 例子 中 ,倾向 于 影响 转录 起 始 的 那些 有 利 突变 , 因 协 同 进化 所 造成 的 后 果 可 能 已 传播 到 
整个 rRNA 多 基因 家 族 。 与 之 不 同 的 是 ,在 关于 RNA 多 聚 酶 工 的 转录 单位 的 例子 中 ,在 任何 二 个 基 
因 中 发 生 的 影响 转录 起 始 的 有 利 突变 ,预期 将 不 会 传 禹 所 有 基因 ,因为 它们 属于 许多 不 同 的 家 族 。 

关于 新 基因 产生 的 传统 观点 是 , 先 发 生 一 次 基因 重复 事件 ,然后 该 重复 产生 的 两 个 基因 之 一 逐渐 
分 化 而 变 成 一 个 新 基因 。 现 已 搞 清 ,该 过 程 可 能 不 象 以 前 所 假定 的 那样 简单 。 只 要 两 个 基因 分 岐 的 程 
度 不 是 很 大 , 则 那个 发 生 分 化 的 拷贝 就 有 可 能 通过 不 等 价 交换 而 被 清除 ,或 者 通过 基因 转变 而 转化 成 
保持 原样 的 拷贝 。 在 前 一 种 情况 下 , 它 需 要 再 发 生 一 次 重复 以 产生 一 个 新 的 多 余 拷 贝 ;而 在 后 一 种 情 
况 下 则 必须 从 头 开始 分 化 。 所 以 ,重复 基因 的 岐 化 进程 可 能 比 传统 上 认为 的 要 慢 得 多 ,为 此 缘故 一 个 
新 基因 从 某 一 多 余 拷 贝 中 产生 的 机 会 就 减少 了 。 另 一 方面 ,基因 转变 也 可 能 会 阻止 一 个 多 余 的 拷贝 长 
时 期 地 成 为 无 功能 状态 ,或 者 也 许 能 有 选择 地 使 一 个 “ 死 基因 ”( 假 基因 ) 复 活 过 来 (Walsh,1987) 。 

我 们 已 经 习惯 于 假定 ,在 一 次 基因 重复 之 后 ,两 个 随 之 而 来 的 基因 将 随时 间 单调 地 上 岐 化 着 。 在 这 
样 的 假定 下 ,我 们 前 面 已 经 证 明 ,推测 重复 事件 的 时 间 是 相当 简单 的 。 例 如 ,人 B 一 和 8 一 珠 蛋 白 的 蛋 
白质 顺序 相互 间 相 似 的 程度 比 与 兔 Bl 或 与 小 鼠 B 的 主要 和 次 要 顺序 的 要 高 (Dayhoff,1972)。 因 此 曾 
有 过 这 样 的 推测 :人 的 这 两 个 基因 是 从 约 4000 万 年 以 前 的 一 次 重复 事件 中 衍生 而 来 的 ,这 个 时 间 远 
在 哺乳 类 辐射 ( 约 8000 万 年 以 前 ) 之 后 。 考 虑 到 重复 基因 能 相互 较 正 这 样 一 个 事实 , 则 这 一 结论 就 可 
能 是 错误 的 。 事 实 上 ,近来 已 经 有 人 提出 ,8 和》 基因 起 源 于 发 生 在 哺乳 类 辐射 之 前 的 一 次 重复 
(Hardison 和 Margot,1984)。 该 提议 是 根据 这 样 的 观察 事实 而 作出 的 , 免 假 基因 灿 2 的 大 内 含 子 和 3’ 
不 翻译 区 与 人 的 8 的 相似 程度 比 与 免 Bl 的 高 ,小 鼠 的 假 基因 Bh3 相似 于 其 3 未 端 上 的 8。 如 果 这 一 候 
说 结果 是 正确 的 , 则 以 上 例子 极 好 地 说 明了 ,基因 一 校正 事件 将 会 怎样 部 分 或 全 部 地 抹 擦 掉 重 复 基因 
间 分 歧 进 化 的 历史 .在 大 的 多 基因 家 族 中 ,基因 一 校正 事件 预期 是 频频 发 生 的 ,在 这 种 情况 下 ,追踪 家 
族 成 员 间 的 进化 关系 将 会 更 为 困难 。 
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从 进化 论 的 观点 看 ,多 基因 家 族 的 进化 和 分 群体 的 进化 之 间 存 在 着 某 种 类 比 。 我 们 可 以 把 多 基因 
家 族 中 的 每 一 种 重复 看 成 是 分 群体 中 的 一 种 同类 群 。 那 么 重复 间 信 息 的 传递 就 等 价 于 同类 群 间 基 因 
或 个 体 的 迁移 。 众 所 周知 ,迁移 将 减少 两 同类 群 间 遗 传 差 异 的 量 , 但 会 增加 一 个 同类 群 中 的 遗传 变异 
的 量 ( 例 如 等 位 基因 的 数目 )。 类 似 地 ,重复 间 的 信息 传递 将 会 减少 重复 间 的 遗传 差异 但 将 增加 某 一 基 
因 座 位 上 的 遗传 变异 的 量 (Ohta,1983,1984;Nagylaki,1984)。 小 鼠 主 组 织 相 容 复 合体 中 某 些 基因 座 
位 是 高 度 多 态 的 ,事实 上 ,已 观察 到 某 一 基因 座位 上 的 等 位 基因 数 多 达 50 个 .所 以 , 曾 有 人 提出 ,这 种 
程度 较 高 的 多 态 性 是 由 基因 转变 所 造成 的 (例如 Weiss 等 ,1983; 但 可 参阅 Hughes 和 Nei,1989 ) 。 


习题 


1、 与 某 一 随机 选 出 的 DNA 片段 的 重复 相 比 ,外 显 子 重复 有 什么 优点 ? 

2、 在 重 琵 基 因 中 , 简 并 位 点 的 数目 能 大 大 地 被 削减 。(a) 如 果 下 面 的 顺序 仅 按 第 1 个 阅读 框架 翻 
译 , 那 么 将 有 多 少 非 简 并 位 点 ? 多 少 四 重 简 并 的 位 点 ? (b) 如 果 除 了 第 一 个 阅读 框架 外 ,该 顺序 也 按 第 
2 个 阅读 框架 翻译 ,那么 将 有 多 少 非 简 并 位 点 和 四 重 简 并 位 点 ? 〈c) 如 果 3 个 阅读 框架 都 进行 翻译 , 那 
么 该 顺序 中 的 非 简 并 位 点 和 四 重 简 并 位 点 将 是 多 少 ? 〈3 个 阅读 框架 的 起 始点 各 用 箭头 标 出 )。 


CATTCGTCTTTATTCGAAATCGCGTGGACAGCGGTGGATCTCTTTGCGCTGTGCAAAGCAGCGCTGGCGGTT 
2 
3 


3、\ 许 多 多 聚 体 蛋白 质 是 由 重复 基因 编码 的 亚 基 所 构成 。 有 两 种 可 能 情况 :(a) 这 些 亚 基 可 能 全 部 
来 自 一 个 基因 座位 ,也 可 能 来 自 不 同 的 基因 座位 。 在 前 一 种 情况 下 该 蛋白 质 被 称 为 是 “ 同 质 型 的 ”, 而 
后 一 种 情况 下 则 是 “ 异 质 型 的 "。 假 定 该 蛋白 质 象 乳酸 脱 氢 酶 (LLDH, 见 第 84 页 原版 ) 那 样 是 一 种 四 聚 
体 酶 , 且 其 所 有 亚 基 由 两 个 基因 座位 编码 .那么 ,能 产生 多 少 种 不 同 的 同 功 酶 ?(b) 这 样 的 蛋白 质 常 常 
是 异 质 型 的 ( 即 ,常常 是 由 不 同 基因 座位 产生 的 亚 基 所 构成 的 )。 例 如 ,哺乳 类 成 体 的 血红 蛋白 是 一 个 
由 两 条 链 和 两 条 有 B 链 构成 的 四 聚 体 . 假 定 在 某 一 种 哺乳 动物 中 有 3 个 % 样 基因 座位 和 2 个 B 样 基因 座 
位 。 那 么 ,如 果 每 一 个 四 聚 体 是 由 两 个 a 样 基因 座位 产生 的 亚 基 和 两 个 B 样 基因 座位 产生 的 亚 基 所 构 
成 的 话 , 则 能 产生 多 少 不 同 的 异 质 型 四 聚 体 ? 

4 在 大 鼠 和 小 鼠 的 基因 组 中 有 两 个 为 胰岛 素 编码 的 基因 (前 胰岛 素 原 工 和 I), 而 在 除 呈 齿 类 以 
外 的 哺乳 动物 中 则 只 有 一 个 胰岛 素 基 因 。 前 胰岛 素 原 I 基因 被 认为 是 通过 一 个 上 所谓“ 反 录 转 座 “”( 第 七 
章 ) 的 过 程 而 产生 的 。 前 胰岛 素 原 I 和 工 这 两 个 基因 都 在 5' 不 翻译 区 中 含有 一 个 小 内 含 子 (长 为 118 个 
核 苷 酸 )。 大 鼠 和 小 鼠 中 的 内 含 子 对 子 间 , 核 苷 酸 差异 数 如 下 : 


内 合子 
内 含 子 小 鼠 1 小 鼠 I KA 1 
yf 1 21 
A fat I 15 25 
AK fa 16 24 18 


Ca) REE AY BCE aS 4 ly BT BE EDC BR) BE BL PY A) EDA A 
进化 快 ,为 什么 ?(b) 假 定 核 苷 酸 替 换 的 速率 恒定 ,并 且 假 定 小 鼠 和 大 鼠 在 1500 万 年 前 发 生 分 岐 ,请 用 
小 鼠 I 和 大 鼠 工 但 排除 小 鼠 工 ,来 估计 前 胰岛 素 原 1 和 工 间 的 分 岐 时 间 。 

5、 在 以 下 顺序 的 内 含 子 (虚线 ) 中 插入 一 个 0 一 0 对 称 外 显 子 。 那 么 对 阅读 框架 而 言 将 会 发 生 什么 ? 
如 果 插 入 一 个 2 一 2 对 称 外 显 子 会 发 生 什 么 呢 ? 如 果 插 入 一 个 不 对 称 外 显 子 又 会 发 生 什 么 ? 

SCOTTCGITCT TTA TTC GAA ATC GCG 一 一 一 TGG ACA GCG GTG AAT CTC 
TTT GAC GCT GTG—3’ 

6 ,为 什么 一 个 串联 重复 的 家 族 能 比 一 个 散布 重复 的 家 族 更 容易 经 历 协同 进化 ? 请 解释 
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7 由 转 座 造成 的 进化 


基因 组 曾经 被 认为 是 相当 静止 的 实体 ,在 其 中 可 以 给 基因 指定 一 个 界限 明确 的 基因 座位 。 因 此， 
基因 被 想象 成 在 漫长 的 进化 时 期 里 一 直 停 留 在 它们 正好 所 处 的 染色 体位 置 上 。 当 芭 芭 拉 .麦克 林 托 克 
(Barbara McClintock ) 在 十 九 世 纪 四 十 年 代 发 现 玉米 中 的 某 些 遗传 成 份 能 从 一 个 基因 组 座位 " 跳 到 ?” 
另 一 个 上 ,不 时 地 改变 着 结构 基因 的 表达 时 ,基因 组 的 这 种 静态 图 景 开 始 崩 省。 然而 ,这 种 凝固 静止 的 
图 景 在 科学 思想 界 中 已 积 习 难 改 , 以 至 于 人 们 花 了 近 40 年 的 时 间 才 认识 到 麦克 林 托 克 这 一 开创 性 发 
现 的 意义 。 今 天 我 们 认识 到 ,基因 组 的 结构 组 织 比 以 前 所 想象 的 要 更 富 于 流动 性 ` 且 更 易于 发 生 进 化 
变化 。 在 这 一 章 里 ,我 们 将 描述 大 量 有 助 于 遗传 物质 从 一 个 基因 组 处 位 向 另 一 个 处 位 运动 的 可 转 座 因 
子 , 并 且 讨 论 这 类 因子 对 进化 过 程 可 能 会 产生 的 影响 。 


7.1 转 座 与 反 录 转 座 


转 座 (transposition ) 的 定义 是 ,遗传 物质 从 一 个 染色 体位 置 向 另 一 个 位 置 的 运动 。 具 有 能 改变 其 
基因 组 位 置 这 种 内 在 光 能 的 DNA 序列 ,被 称 为 易 动 因子 (mobile elements) 或 可 转 座 因子 (transpos- 
able elements) .根据 可 转 座 因 子 是 否 被 复制 来 区 分 , 则 有 两 种 类 型 的 转 座 。 在 保守 型 (conservative ) 转 
座 中 ,该 因子 从 一 个 位 点 移 到 另 一 个 位 点 (图 7 一 la) , 供 体位 点 上 发 生 了 什么 则 不 清楚 .有 一 种 模型 提 
tH, PEAR DNA 的 末端 不 是 相互 连结 的 ,因而 转 座 后 剩余 下 来 的 分 子 就 瓦解 了 。 然 而 ,如 果 细 胞 含有 该 
供 体 序列 的 重复 , 则 该 供 体 DNA 种 即 可 避免 从 细胞 谱系 中 丢失 。 在 这 种 情况 下 ,虽然 消耗 了 一 个 拷 
贝 ,但 另 一 个 却 幸 存 了 下 来 ,由 此 而 产生 的 谱系 将 在 原始 位 点 上 有 一 个 因子 ,而 在 新 位 点 上 有 第 2 个 因 
子 (Berg 等 ,1984) 。 另 一 种 模型 提出 ,该 双 链 断裂 是 由 宿主 的 修复 系统 所 修复 的 。 

在 复制 (型 )(replicative) 或 重复 (型 ) (duplicative) 转 座 中 ,可 转 座 因 子 被 拷贝 ,并且 其 中 一 个 拷贝 
留 在 原 位 点 处 , 另 一 个 则 插入 一 个 新 位 点 中 (图 7 一 1b)。 所 以 ,复制 型 转 座 的 特征 是 可 转 座 因子 的 拷贝 
数 的 增加 .有些 可 转 座 因子 只 采用 一 种 类 型 的 转 座 , 而 另 一 些 则 对 保守 型 和 复制 型 两 种 方式 全 采用 。 

在 以 上 转 座 类 型 中 ,遗传 信息 由 DNA 所 携带 。 已 知 遗 传 信息 也 能 通过 RNA 而 转 座 。 在 这 种 模式 
中 ,DNA 被 转录 成 RNA, 然 后 RNA 再 反 转 录 成 cDNA( 图 7 一 1C)。 为 了 将 这 两 种 模式 加 以 区 别 ,我 们 
把 由 RNA 中 介 的 模式 称 为 反 录 转 座 (retroposition ) 。 转 座 与 反 录 转 座 都 曾 既 在 真 核 生物 中 又 在 原核 
生物 中 发 现 ( 见 Weiner 等 ,1986;Temin,1989)。 与 由 DNA 中 介 的 转 座 相 比 , 反 录 转 座 总 是 复制 型 的 ， 
因为 被 转 座 的 是 该 因子 的 反 转 录 拷 贝 , 而 不 是 该 因子 本 身 。 

当 一 个 可 转 座 因 子 插入 一 个 宿主 基因 组 中 时 ,在 该 插入 位 点 处 的 一 小 段 宿 主 DNA( 通 常 为 4 一 
12bp) 被 复制 (图 7 一 1)。 这 种 经 复制 的 重复 有 同一 取向 ,因而 被 称 为 顺 向 重复 (direct repeats) 。 这 是 转 
座 和 反 录 转 座 的 特征 标记 。 

有 些 可 转 座 因子 能 转 座 到 所 有 细胞 中 去 ;而 另 一 些 则 是 高 度 特异 的 。 例 如 , 果 蝇 DD. melanogaster 
的 已 因子 通常 仅 在 生殖 细胞 中 是 易 动 的 。 转 座 的 接受 位 点 的 基因 组 位 置 在 不 同 可 转 座 因 子 中 也 表现 
出 有 变异 。 有 些 因子 对 某 一 特别 的 基因 组 位 置 表 现 出 不 寻常 的 偏爱 。 例 如 ,7S4 总 是 精确 地 将 自己 控 
人 到 大 肠 杆 菌 的 半 乳 糖苷 酶 操纵 子 中 的 同一 点 上 ,所 以 ,每 个 细菌 只 能 含有 一 个 拷贝 的 TS4(Klaer 
等 ,1981) 。 另 外 一 些 , 象 噬菌体 Mw, 则 能 随机 地 转 座 到 几乎 任何 基因 组 位 置 上 。 许 多 可 转 座 因 子 则 表 
现 出 中 等 程度 的 基因 组 位 置 偏向 性 。 例 如 , 玖 .coii 的 Tzl10 转 座 子 ,其 40 被 发 现 位 于 ac Z 基因 中 ,成 
为 基因 组 的 精细 结构 部 分 ; 己 因 子 对 X 染色 体 有 亲 合 性 , 且 偏 向 于 插 人 从 5 端 靠 近 基 因 编 码 区 的 序列 
中 ,而 不 是 编码 区 之 中 .有 些 可 转 座 因子 对 某 种 特别 的 核 苷 酸 组 成 展示 出 有 更 高 的 亲 合 性 .例如 ,Ts1 
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(a) 可 转 座 因子 = 


Oe ree A Se 一 一 和 一 一 
Ee Rs ? —_—_—_ — 本 一 
供 体 接受 物 村 
， 
(b) 可 转 座 因 子 = . 
oy A a a esd ee 
| xm 
EN 
三 上 —S—_ YY 
供 体 接受 物 
(c) 可 转 座 因子 ca 
ca, 一 一 -一 加 -一 一 一 
| 二 
eS WS | 
| mas 
2 SA 
整合 
—_ 二 -一 一 
供 体 接受 物 
图 7 一 1 (ay) 保 守 型 转 座 。 该 因子 从 供 体 位 点 转 座 到 靶 位 点 。 供 体位 点 处 发 生 了 什么 则 不 清楚 。 该 供 体 分 子 可 能 会 


瓦解 ,这 对 于 具有 一 个 以 上 染色 体 找 贝 的 细菌 而 言 是 可 以 忍 受 的 。 另 一 种 可 能 性 是 ,该 双 链 的 断裂 处 被 宿主 的 修复 
系统 所 修复 。(b) 复 制 型 转 座 。 该 因子 被 复制 ,并 且 有 一 个 拷贝 插入 一 个 靶 位 点 处 ,而 另 一 个 拷贝 则 保留 在 供 体位 点 
上 。 关 于 保守 型 和 复制 型 转 座 的 更 详细 解释 可 参阅 Lewin (1990)。(c) 反 录 转 座 。 该 因子 转录 成 RNA, 然 后 RNA 再 
反 转 录 成 DNA。 该 DNA 拷贝 插入 宿主 基因 组 。 作 为 反 录 转 座 的 一 个 例子 可 见 图 7 一 4。 注 意 , 转 座 与 反 录 转 座 都 会 
在 新 插入 成 份 的 两 端 各 产生 一 小 段 重 复 ( 黑 矩形 块 )。 


偏爱 富 含 AT 的 插入 位 点 (Devos 等 ,1979) 即 是 如 此 。 
7.2 可 转 座 因 子 
可 转 座 因子 ,根据 其 转 座 模式 和 其 所 含 基因 的 数目 与 类 型 ,可 分 成 三 类 :插入 序列 、 转 座 子 和 反 录 
因子 。 


插入 序列 


4fi A FF 9 Cinsertion sequences) 是 最 简单 的 可 转 座 因 子 。 它 们 除 具 有 为 转 座 所 必需 的 部 分 外 不 带 上 
。106。 
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FE fal it 18 fs B.A Fe HE KK Eb i HF 700 — 2500bp, & Ze AM BA, EB PS RA FE OK PA 
fa A Fr 5) eB a TS 加 上 后 随 的 类 型 号 数 来 表示 。 一 个 来 自 肠 道 细 菌 E. coli Shigella dysinteria 的 插 
人 序列 ,7S1 的 结构 ,如 图 7 一 2a 所 示 。7531 在 长 度 上 约 为 770 个 核 苷 酸 , 包 括 两 个 颠倒 的 非 等 同 末 端 重 
复 ,每 个 各 23bp。 它 含有 两 个 阅读 框架 ,7zs4 和 7zsB,， 它 们 为 一 种 或 两 种 形式 的 转 座 酶 (transposase) 
编码 。 转 座 酶 是 一 种 催化 可 转 座 因子 向 插入 位 点 插入 的 酶 在 五 .co 中 有 几 十 种 不 同类 型 的 插入 人 序 
列 , 从 自然 界 分 离 出 的 品系 ,其 大 多 数 的 基因 组 中 所 含 每 种 序列 的 数 是 可 变 的 (Sawyer 等 ,1987) 。 


转 座 子 


转 座 子 (transposons) 是 易 动 因子 ,通常 长 为 2500 一 7000bp 左右 ,大 多 数 在 基因 组 中 作为 散在 重 
复 顺 序 的 家 族 而 存在 。 它 们 与 插入 序列 的 区 别 是 还 带 有 所 谓 外 源 性 基因 (exogenous genes) , il — #6 4 
除 与 转 座 有 关 的 功能 之 外 的 功能 蛋白 质 编 码 的 基因 。( 注 意 , 在 有 些 文献 中 命名 方式 较 混 乱 , 有 时 转 座 
子 这 个 术语 被 用 来 指 所 有 可 转 座 因子 ,包括 插入 序列 ` 反 录 转 座 子 等 .) 在 细菌 中 , 转 座 子 用 前 组 Tn 
和 后 随 的 类 型 号 数 来 表示 .有 些 细菌 转 座 子 是 复合 转 座 子 (complex tremsposons) 或 混合 转 座 子 (com- 
posite transposons) ,这 样 命 名 是 因为 ,有 两 个 完整 而 独立 的 可 转 座 插入 序列 以 任意 一 种 排 向 从 两 个 侧 
面 夹 拥 着 一 个 或 多 个 外 源 性 基因 (图 7 一 2b). 有 趣 的 是 ,在 复合 转 座 子 情况 下 ,不 仅 整个 转 座 子 能 作为 
一 个 整体 转 座 , 而 且 两 侧 的 一 个 或 两 个 择 和 序列 还 能 独立 地 转 座 .。 因 为 转 座 的 功能 是 由 揪 人 序列 编码 
的 ,所 以 .复合 转 座 子 通常 不 含有 一 种 独立 的 转 座 酶 基因 。 
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图 7 一 2 maPHOPTE RAT HRA. ZEACATMEEZ. (AKA E. coli f° Shigella dysenteria 的 插 
入 序列 TS1 两 侧 由 长 为 23bp 的 不 完美 颠倒 重复 所 夹 拥 。(b) 来 自 巨 .coiz 的 复合 转 座 子 Tnz9, 含 有 两 拷贝 7S1, 分 别 位 
于 co 基因 两 侧 。cat 基 因为 具有 和 氟 霉 素 抗 性 的 蛋白 质 编 码 。(c) 来 自 玖 .coli 的 转 座 子 Tmn3, 能 产生 链 霉 素 抗 性 ,含有 3 
个 基因 ， 其 中 两 个 (tmzzpR 和 pa) 在 一 条 链 中 转录 ,第 三 个 (imp4) 则 在 另 一 条 中 转录 。T7mz3 两 侧 都 有 长 为 38bp 的 完美 
fi) SB .(d) & A Staphilococcus aureus 的 T7z554 缺 少 末 端 重复 ,含有 5 个 基因 和 1 个 开放 阅读 框架 (ORF)。 其 中 3 个 
A (inpA.tnpB 和 z 加 pbpC) 为 转 座 酶 编码 , 且 作 为 一 个 单位 而 被 转录 。spc 和 ermA ARAM FMR EME FR fo 
SEHK spo 基因 为 依赖 S 一 腺 若 甲 硫 氨 酸 的 甲 基 化 酶 编码 ,是 在 与 别 的 基因 不 同 的 链 中 转录 的 。ORF 被 大 量 
转录 ,但 是 否 被 翻译 则 尚 不 得 而 知 。 画 有 斜 条 纹 的 矩形 块 不 含 开放 阅读 框架 。 
其 他 的 细菌 转 座 子 ,以 及 许多 真 核 生 物 的 转 座 子 ,其 两 侧 只 有 较 短 的 不 同 取向 的 重复 顺序 (图 7 一 
2c) ,并 且 不 含 插入 序列 。 然 而 ,并 非 所 有 转 座 子 都 是 在 结构 上 对 称 的 .有 些 具 有 不 对 称 的 末端 ,缺少 颠 
倒 的 或 顺 向 的 末端 重复 (图 7 一 2d)。 动 物 中 有 些 转 座 子 (例如 果 蝇 中 的 尸 因子) 的 编码 区 被 内 含 子 所 
隔断 (图 7 一 3)。 


Lt mT | 
图 7 一 3 X88 D. melanogaster 的 书 因 子 的 模式 结构 图 .该 因子 两 仙 有 长 为 31bp 的 短 颠 倒 重复 ,其 编码 区 含有 4 个 外 
显 子 ( 白 和 矩形 块 ), 由 3 个 内 含 子 ( 黑 和 矩形 块 ) 所 隔断 。 该 因子 长 为 2900bp 左右 。 
细菌 中 的 转 座 子 常常 带 有 这 样 一 些 基 因 ,它们 能 给 予 携带 者 以 抗生素 抗 性 (如 T”*554) ,重金 属 搞 
性 (如 Tz21) 或 抗 热 性 (如 Tz1681)。 质 粒 则 可 把 这 样 一 些 转 座 子 从 一 个 细胞 带 到 另 一 个 细胞 , 结 采 ， 
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抗 性 就 能 迅速 传 遍 到 整个 暴露 于 这 样 一 些 环境 因子 中 的 细菌 群体 中 。 
有 几 种 吹 菌 体 事 实 上 是 细菌 中 的 转 座 子 ,或 转 座 性 鸣 菌 体 (transposing bacteriophages) 例 如 , WE 
tk Mu 就 是 一 个 非常 大 的 转 座 子 (一 38000bp) , 它 不 仅 为 那些 调控 其 转 座 的 酶 编码 ,而且 还 为 大 量 构 
成 其 DNA 包装 所 必需 的 结构 蛋白 质 编码 。 
许多 类 型 的 转 座 子 在 动物 、 植 物 和 真菌 的 基因 组 中 广泛 分 布 .例如 果 蝇 DD. melanogaster 就 含有 50 
一 100 种 不 同类 型 的 转 座 子 ,而 且 都 是 多 重 拷贝 的 (Rubin,1983) 。 


反 录 因子 


反 录 因子 (retroelements) 是 含有 一 个 为 反 转 录 酶 编码 的 基因 的 DNA 序列 或 RNA 序列 , 反 转 录 
酶 则 催化 以 RNA 为 模板 的 DNA 的 合成 。 由 此 而 产生 的 DNA 分 子 称 互补 (的 )DNA (complementary 
DNA. cDNA)。 这 些 的 确 转 座 的 反 录 因子 是 通过 反 录 转 座 过 程 而 转 座 的 .有 一 些 不 同类 型 的 反 录 因 
子 ,我 们 采用 由 特 明 (Temin,1989) 提 出 的 分 类 ,并 将 它们 列 于 表 7 一 1。 

反 录 病毒 (retroviruses) 是 一 些 结构 上 类 似 于 转 座 子 的 RNA 病毒 .虽然 它们 是 所 有 反 录 因子 中 
最 复杂 的 ,但 我 们 还 是 最 先 讨 论 它 们 ,因为 反 录 转 座 概 念 起 源 于 对 反 录 病毒 生命 周期 (图 7 一 4) 的 发 
现 。 反 录 病 毒 的 颗粒 称 为 病毒 粒子 (virion), 它 侵入 某 一 宿主 细胞 以 后 ,其 基因 组 RNA 即 被 反 转 录 成 
病毒 DNA。 该 DNA 能 整合 到 宿主 基因 组 中 , 变 成 一 个 前 病毒 (provirus) 。 接 下 来 ,前 病毒 DNA 转录 
成 RNA, 它 们 既 可 作为 合成 病毒 蛋白 质 的 mRNA, 又 可 作为 病毒 的 基因 组 ,并 被 包装 到 具有 感染 性 
的 病毒 粒子 中 。 病 毒 粒 子 一 旦 形成 ,周期 即 可 再 次 开始 。 

表 7 一 1 反 录 因子 和 反 录 序列 的 分 类 


因 cia 反 转 录 酶 转 座 LTR’ 是 否 存在 病毒 粒子 
反 录 子 是 否 否 否 
反 转 录 子 是 是 否 否 
反 录 转 座 子 是 是 是 否 
反 录 病毒 是 是 是 是 
拟 反 录 病 毒 是 否 是 是 
反 录 序列 否 否 否 ra 
自 Temin(1989). 


a,LTR, KA Sn HR . 

反 录 病毒 至 少 具 有 3 个 基因 :gag,zpol 和 ex( 图 7 一 5)。 这 些 基 因 分 别 为 几 种 内 部 蛋白 质 、 几 种 酶 
(包括 一 种 反 转 录 酶 ) 和 一 种 被 膜 蛋白 编码 .许多 反 录 病毒 还 有 别 的 基因 :例如 艾滋 病毒 至 少 有 6 个 额 
外 基因 。 反 录 病 毒 的 编码 区 两 侧 有 长 未 端 重复 (long terminal repeats, LTRs) .LTR 含有 与 转录 (在 前 
病毒 阶段 ) 有 关 的 启动 子 和 与 反 转 录 ( 在 病毒 阶段 ) 有 关 的 启动 子 。 

反 转 录 子 (retroposons) 和 反 录 转 座 子 (retrotransposons) 是 不 构成 病毒 粒子 的 可 转 座 因 子 , 所 以 ， 
它们 与 反 录 病毒 不 同 , 不 能 独立 地 穿越 细胞 而 转 座 .它们 间 的 相互 区 别 是 ,是 否 存在 末端 重复 顺序 
(CLTR)( 表 7 一 1)。 注 意 , 有 些 作 者 是 将 反 转 录 子 和 反 录 转 座 子 当 作 同义词 来 用 的 。 果 蝇 中 的 copia A 
子 代 表 一 种 典型 的 反 录 转 座 子 ; 它 的 两 端 都 具有 LTR ,并 且 还 含有 一 段 长 的 开放 阅读 框架 ,其 中 有 类 
似 于 反 录 病毒 的 pol 基因 的 区 域 . 图 7 一 5b 所 示 的 是 另 一 个 反 录 转 座 子 的 例子 , 即 粘 性 霉菌 Dic- 
tyostelium discoideum 中 的 DTIRS 一 1 因子 。D. discoideum 平均 含有 40 个 左右 的 完整 DTIRS 一 1 拷贝 ,以 
及 大 约 200 一 300 个 的 DTIRS 一 1 片段 。 有 趣 的 是 ,DTIRS 一 1 有 一 种 将 自己 插入 别 的 DTIRS 一 1 序列 中 ,从 
而 抵消 它们 的 作用 的 倾向 ,这 或 许 是 粘性 霉菌 基因 组 中 存在 许多 有 缺陷 的 DTIRS 一 1 片段 的 原因 
(Cappello 等 ,1984) .DTRS 一 1 基因 的 转录 受 发 育 阶段 诱导 ,也 受热 震惊 的 诱导 。 

与 反 录 转 座 子 不 同 , 反 转录 子 不 含 LTR. YA D. melanogaster 中 的 C34 因子 是 一 个 反 转 录 子 
(图 7 一 5c)。 这 种 反 转 录 子 含有 两 个 ORF。.ORF 一 1 含有 一 个 与 反 录 病毒 的 pol 基因 类 似 的 区 域 ,而 
OREF 一 2 则 含有 7 个 由 非常 短 的 间隔 顺序 隔 开 的 外 显 子 。 

反 录 子 (retrons) 是 最 简单 的 反 录 因子 (图 7 一 5d) 。 它 们 曾 在 某 些 细菌 基因 组 中 发 现 (Inouye 等 ， 
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一 反 录 病毒 受 体 


HH Iz Fe a 
复制 成 DNA 


病毒 mRNA 


整合 了 的 前 病毒 


细胞 幸存 并 继 终 
不 定时 地 产生 病毒 
图 7 一 4 一 个 反 录 病毒 生命 周期 的 概貌 。 反 录 病 毒 的 病毒 粒子 附着 到 细胞 表面 的 一 个 受 体 上 .基因 组 RNA 注入 细 
胞 质 中 ,在 那里 通过 反 转 录 酶 的 作用 而 被 反 转 录 。cDNA 穿 入 细胞 核 ,并且 可 能 会 整合 到 宿主 细胞 的 基因 组 之 中 。 
整合 进去 的 前 病毒 被 转录 成 ,(1) 用 于 合成 病毒 蛋白 的 mRNA, 和 (2) 基 因 组 RNA。 该 基因 组 RNA 与 结构 蛋白 质 和 
酶 性 蛋白 质 装 配 成 有 感染 性 的 病毒 粒子 ,以 出 芽 的 形式 穿 出 细胞 膜 。 自 Watson 等 (1987) 。 
1989;Lampson 4, 1989), th, & 4E 44 'W Oenothera berteriana 的 线粒体 基因 组 中 发 现 (Schuster 和 Bren- 
nicke. 1987) ,它们 的 开放 阅读 框架 中 有 与 其 他 反 转 录 酶 基因 类 似 的 顺序 。 然 而 , 反 录 子 不 切 离 , 因 而 
是 构成 基因 组 整体 的 必要 部 分 .与 前 病毒 不 同 , 反 录 子 没有 LTR ,也 不 能 构成 病毒 粒子 。 
拟 反 录 病毒 (pararetroviruses) ,如 乙 型 肝炎 病毒 ,是 结构 上 类 似 于 反 录 病毒 ,但 已 失去 了 将 自己 插 
入 宿主 基因 组 中 的 能 力 的 一 类 病毒 .由 于 这 个 缘故 它们 是 不 够 作为 可 转 座 因 子 的 资格 的 ,虽然 它们 显 
然 与 反 录 病毒 有 着 共同 的 进化 起 源 。 
所 有 反 录 因子 的 反 转录 酶 都 有 某 些 氨基 酸 等 同性 ,这 一 事实 表明 了 这 些 因 子 有 一 种 共同 的 进化 
起 源 .由 于 反 录 子 与 反 录 病毒 的 复杂 结构 相反 具有 简单 性 ,又 由 于 细菌 的 古老 性 ,所 以 , 特 明 (Temin， 
1989) 认 为 ,进化 的 途径 是 从 反 录 子 到 反 转 录 子 、 到 反 录 转 座 子 . 到 反 录 病毒 .到 拟 反 录 病毒 (图 7 一 6)。 
当然 , 某 些 现存 的 反 录 转 座 子 有 可 能 是 从 反 录 病毒 衍生 而 来 ,而 不 是 从 它 周围 的 另 一 通路 衍生 而 来 。 
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图 7 一 5 RRAFHRABH TAM ERATARHABGHRAHEK; MPAA MH SRAM A ZEURAT; 


BRAEAH ERARKA ME AZ(LTR) ORF, PHA RER (a) MMRRME MAE HH AM AAA 
等 同 的 LTR ,各 长 482 和 472bp。 该 编码 区 为 两 个 多 重 蛋 和 白 前 体 编码 。 由 gag-poll 区 编码 的 多 重 蛋 白 前 体 将 分 裂 成 两 
个 多 重 蛋 白 , 分 别 对 应 于 gag 和 pol.gag 多 重 蛋 白 产生 4 种 内 部 病毒 蛋白 质 , 分 别 用 p15,p12,p27,p10 表 示 。zpol 多 
重 蛋 白 则 分 裂 成 3 种 酶 ,一 种 蛋白 酶 ,一 种 反 转 录 酶 ,和 一 种 内 切 核酸 酶 /整合 酶 。 由 ezm 编码 的 多 重 蛋 白 前 体 分 裂 
成 两 种 被 膜 蛋 白 、 分 别 用 p70 和 plsxA A. (b) HH | B (Dictyostelium discoideum) 4 KR 4 HF DIRS—1. MI) #4 
LTR 长 为 200 一 350bp.ORF 一 2 含有 一 个 顺序 与 反 录 病毒 的 pol 基因 类 似 的 区 域 ;(c) 果 晶 D. melanogaster 的 反 转 
RF G34.ORF 一 1 含有 一 个 顺序 与 反 录 病毒 的 pol 基因 类 似 的 区 域 。 注 意 LTR 缺乏 这 一 特征 。(d) 来 自 粘 球菌 
M yxococcus xanthus 的 反 录 子 。 其 中 ,masr- 基因 被 转录 成 RNA; 而 isQd 基因 则 从 互补 的 链 上 转录 ,然后 再 经 由 该 反 录 
子 的 ORF 编码 的 反 转 录 酶 反 录 成 DNA。 反 录 产 生 的 两 个 分 子 接着 通过 2' 、5'- 磷 酸 二 酯 键 而 相互 连结 ,从 而 形成 被 


称 为 复 找 贝 单 链 DNAIOnmESDNA) 的 分 枝 形 分 子 。 注 意 这 里 没有 LTR。 
环 状 DNA 病毒 


失去 反 转 录 酶 
拟 反 录 病毒 
失去 转 座 能 力 
反 录 病毒 
| 获得 结构 基因 
反 录 转 座 子 
获得 LTR 
反 转 录 子 
获得 转 座 能 力 


发 于 
图 7 一 6 反 录 因 了 于 的 一 种 可 能 进化 路 线 的 模式 图 。 


7.3 反 录 序列 


反 录 序列 (retrosequences 或 retrotranscripts) ,是 通过 RNA 的 反 转 录 而 得 到 、 接 着 整合 到 基因 组 
中 、 但 缺乏 产生 反 转 录 酶 能 力 的 基因 组 的 序列 ( 表 7 一 1)。 产 生 反 录 序 列 的 模板 通常 是 某 一 基因 的 
RNA 转录 本 .有 些 作者 把 反 录 序列 称 为 “ 非 病 毒 的 反 转 录 子 ”例如 Weiner 等 ,1986) 。 一 种 产生 反 录 
序列 的 过 程 如 图 7 一 7 所 示 .如 果 某 一 基因 不 在 任何 种 系 细 胞 中 转录 ,那么 ,产生 反 录 序列 就 需要 RNA 


跨越 细胞 障碍 .这 可 以 通过 以 下 方式 实现 , 即 RNA 分 子 被 包 进 某 一 反 录 病毒 的 病毒 粒子 中 ,然后 传 . 


送 到 种 系 细 胞 ,并 在 那里 被 反 转 录 (Linial,1987) 。 这 一 过 程 被 命名 为 反 录 转 染 (retrofection ) 。 


es。 1]110。 


| 
| 


由 于 反 录 序列 起 源 于 RNA 序列 ,所 以 它们 带 有 一 些 进行 过 RNA 加 工 的 标记 ,因而 又 称 为 加 工 
后 序列 (processed sequences) 。 反 录 序 列 的 特征 包括 :(1) 缺 少 内 含 子 ,(2) 与 基因 的 转录 区 域 有 精确 一 
致 的 边界 ,(3) 在 3' 端 有 poly-A 延伸 物 ,(4) 在 两 端 都 有 短 的 顺 向 重复 ,这 指示 可 能 已 涉及 转 座 ,(5) 各 
种 转录 后 的 修饰 ,如 短 核 苷 酸 延 伸 物 的 加 入 或 去 除 ,以 及 (6) 序 列 所 在 染色 体 上 的 位 置 已 不 同 于 转录 
产生 RNA 的 原始 基因 的 基因 座位 。 

存在 有 两 种 类 型 的 反 录 序列 :加 工 后 基因 (或 反 录 基因 ) 和 加 工 后 假 基因 (或 反 录 假 基因 ) 


| #2 
ee ea 
| 加 工 
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图 7 一 7 加工 后 反 录 序列 的 产生 . 黑 块 状 体 表示 外 显 子 .波纹 线 表 示 mRNA 中 的 多 聚 A 尾 巴 和 cDNA 中 的 互补 多 
% T.DNA 被 转录 成 前 体 mRNA ,然后 被 加 工 成 mRNA。mRNA 再 被 反 转 录 成 cDNA,cDNA 则 整合 进 基 因 组 
DNA 中 。 裂 缝 被 修复 ,这 样 在 插入 的 反 录 序列 两 段 侧 就 产生 了 两 段 顺 向 的 短 重 复 ( 黑 水 平 箭头 )。 如 果 cDNA 从 合 
成 RNA 的 细胞 转播 入 到 一 个 不 同 细 胞 的 基因 组 中 , 则 产生 反 录 序列 的 过 程 就 需要 mRNA 包装 进 一 个 反 录 病毒 料 
子 中 ,并 且 转 移 到 那个 郑 细胞 里 。 这 样 的 过 程 称 反 录 转 染 。 


反 录 基因 


加 工 后 基因 (processed gene) 或 反 录 基因 (retrogene) 是 一 种 有 功能 的 反 录 序列 , 它 产 生 的 蛋白质 
与 产生 该 反 录 基因 的 原 基 因 所 产生 的 蛋白 质 等 同 或 接近 等 同 。 有 几 个 原因 可 以 说 明 为 什么 一 个 反 转 
录 的 基因 保留 其 功能 的 可 能 性 很 小 .第 一 , 反 转 录 过 程 是 很 不 精确 的 ,以 至 RNA 模板 与 cDNA 之 间 
可 能 会 出 现 许 多 差异 (突变 )。 第 二 ,除非 加 工 后 基因 是 从 一 个 由 RNA 多 聚 酶 下 转录 的 基因 衍生 而 
来 ,否则 它 通常 不 含有 那些 位 于 不 转录 区 中 的 必需 调控 序列 .第 三 ,加 工 后 基因 有 可 能 被 插 人 到 不 适 
于 其 正确 表达 的 基因 组 位 置 上 .事实 上 ,在 绝 大 多 数 情况 下 ,一 个 加 工 后 基因 就 是 一 个 “垂死 者 ”。 
令 人 惊奇 的 是 ,加 工 后 的 有 功能 基因 已 被 发 现 , 虽 然 它们 看 来 是 非常 罕见 的 .人 的 磷酸 甘油 酸 激 
酶 CPGK) 多 家 族 由 一 个 活性 的 X 一 连锁 基因 、 一 个 加 工 后 的 X 一 连锁 基因 和 一 个 额外 的 常 染 色 体 基 
因 所 组 成 .该 X 一 连锁 基因 含 11 个 外 显 子 和 10 个 内 合子 。 另 一 方面 , 它 的 常 染 色 体 同 源 物 却 是 不 寻常 
的 , 它 没有 内 含 子 并 且 它 的 3' 端 由 一 个 poly-A 尾巴 的 剩余 物 构成 侧翼 ,这 极 有 力 地 表明 曾 发 生 过 涉 
及 mRNA 的 反 转 录 过 程 。 有 趣 的 是 ,该 常 染色 体 的 PCK 基因 几乎 独特 地 在 备 丸 中 表达 .于 是 , 反 转 
录 而 成 的 PGK 基因 不 仅 保留 了 完整 的 阅读 框架 和 转录 并 产生 有 功能 的 多 肽 的 能 力 , 而 且 还 获得 了 
一 种 新 的 组 织 特异 性 (McCarrey 和 Thomas,1987) 。 鸡 中 的 肌肉 特异 的 钙 调 素 (calmodulin) 基 因 也 是 
无 内 含 子 的 ,显然 也 是 经 由 反 转 录 酶 中 介 的 事件 而 产生 的 (Gruskin 等 ,1987)。 
大 鼠 和 小 鼠 的 前 胰岛 素 原 II 基因 可 能 是 半 加 工 反 录 基因 (semiprocessed retrogene) 的 一 个 代表 性 
例子 .该 基因 在 5' 不 翻译 区 中 有 一 个 长 119bp 的 内 含 子 。. 相 比 之 下 , 它 的 同 源 物 前 胰岛 素 原 工 ,含有 与 
etl * 


它 同样 的 小 内 含 子 , 另 外 还 有 一 个 存在 于 ec 肽 编码 区 中 的 较 大 (499bp) 内 含 子 。 来 自 其 他 哺乳 类 ,包括 
其 他 路 齿 类 在 内 的 所 有 前 胰岛 素 原 基因 也 含有 两 个 内 含 子 。 而 且 , 前 胰岛 素 原 1 基因 两 侧 由 短 重 复 夹 
拥 , 且 在 多 聚 腺 苷 化 信号 后 有 一 段 短 多 聚 AGpoly-A) 区 (Soares 等 ,1985) 。 这 些 特征 表明 ,前 胰岛 素 原 
I 基因 可 能 是 从 被 部 分 加 工 的 前 胰岛 素 原 工 基因 的 前 体 mRNA 衍生 而 来 的 半 加 工 反 录 基 因 。 事 实 
上 ,根据 这 两 个 前 胰岛 素 原 基因 间 的 比较 ,前 胰岛 素 原 I 看 来 是 从 一 个 偏离 了 正轨 的 前 体 mRNA 转 
录 本 衍生 而 来 的 ,该 转录 本 起 始 于 正常 帽子 部 位 上 游 的 500 个 碱 基 对 处 , 且 只 有 第 一 个 内 含 子 从 它 里 
面 切 离 了 。 正 是 因为 该 偏离 了 正轨 的 转录 本 含有 未 被 正常 转录 的 5' 调 探 序列 , 反 录 基因 在 整合 到 一 
新 基因 组 位 置 后 才 保 留 了 它 的 功能 。 


加 工 后 假 基因 
加 工 后 假 基 因 (processed pseudogene) 或 反 录 假 基 因 (retropseudogene) 是 一 个 失去 其 功能 的 反 录 
序列 . 它 带 有 一 切 有 功能 的 反 录 序列 的 标记 ,但 却 有 一 些 妨碍 其 表达 的 分 子 缺 陷 。 一 个 有 功能 的 基因 
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图 7 一 8 Ass Cu/Zn 2 Ab hy ok 10 A IK A CSOD-1) #4 ait FR AS 9b BH — 4 Ae LG RR OV 69. 1) 的 同 源 部 分 间 
的 比较 。 圆 点 表示 替换 ,一 ”表示 缺失 ,十 ”号 表示 插入 。 注 意 内 含 子 的 缺乏 和 上 成熟 前 终止 密码 子 (用 星 号 指示 出 )。 
关于 单字 母 氨基 酸 缩写 可 参阅 表 1 一 1。 资 料 自 Danciger 等 (1986) 。 

一 个 加 工 后 假 基 因 间 的 比较 如 图 7 一 8 所 示 。 许 多 加 工 后 假 基 因 在 反 录 转 染 期 间 被 截 去 端 部 ;加 工 后 
mRNA 的 5 截 尾 特别 普遍 ,但 3' 截 尾 也 是 兽 有 所 闻 的 。5' 端 被 截 去 可 能 发 生 在 :(1) 转 录 期 间 ( 例 如 从 
正常 位 置 的 下 游 起 始 转录 ),(2)RNA 加 工期 间 ( 例 如 错误 地 拼接 ) ,或 (3) 反 转录 期 间 ( 例 如 酶 在 反 转 
录 进 行 到 RNA 分 子 的 3' 端 之 前 失效 ,该 部 位 对 应 于 cDNA 的 5 Shit) 

已 经 知道 了 从 所 有 类 型 的 RNA( 例 如 mRNA,tRNA,rRNA,snRNA 和 7SL RNA) 衡 生 而 来 的 加 

后 假 基 因 。 转 运 RNA 特别 有 趣 ,因为 它们 提供 了 一 个 最 有 说 服 力 的 证 据 , 表 明 加 工 后 假 基因 事实 
上 是 通过 RNA 的 反 转 录 而 派生 出 来 的 .所 有 细胞 核 {RNA 都 在 3' 端 有 一 个 CCA 序列 (图 7 一 9) 。 该 序 
列 不 由 确定 该 NA 的 基因 编码 ,而 是 转录 后 经 酶 作用 加 上 去 的 .对 比 之 下 ,基因 组 的 加 工 后 tRNA 
假 基 因 则 常常 在 3' 末 端 有 CCA 顺序 。 

加 工 后 假 基因 已 在 动物 .植物 .甚至 细菌 中 发 现 . 不 过 ,虽然 加 工 后 假 基 因 在 哺乳 类 中 大 量 存在 ， 
但 它们 在 其 他 生物 , 象 鸡 两栖 类 和 果 蝇 中 却 相对 地 较为 稀有 。 表 7 一 2 列 出 了 人 类 和 吵 齿 类 中 的 某 些 
加 工 后 假 基 因 , 这 些 假 基 因 以 及 它们 的 功能 基因 的 数目 都 是 已 知 的 ,或 已 估 出 的 。 平 均 下 来 ,在 这 些 物 


种 中 加 工 后 假 基 因 的 数目 比 功能 基因 的 数目 要 多 .事实 上 ,在 许多 情况 下 加 工 后 假 基因 的 数目 甚至 有 


可 能 是 被 低估 了 的 ,因为 古老 的 加 工 后 假 基因 可 能 在 顺序 上 与 其 亲本 基因 发 生 了 较 大 程度 的 岐 化 ,以 
° 11 
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NA 假 基因 的 基因 组 顺序 中 出 现 。 


至 用 从 其 功能 基因 同 源 物 制造 出 的 分 子 探 针 已 不 再 能 将 它们 检 出 来 了 。 
表 7 一 2 ” 反 录 假 基因 和 其 亲本 功能 基因 的 数目 


物种 


小 鼠 


大 鼠 


基因 
Hi ARR A a 
B 一 肌 动 蛋白 
B 一 微 管 蛋白 
Cu/Zn 超 氧化 物 岐 化 酶 
细胞 色素 C 
二 氢 叶 酸 还 原 酶 
非 肌 的 原 肌 球 和 蛋白 
甘油 醛 一 3 一 磷酸 脱 氢 酶 
磷酸 甘油 酸 激酶 
核糖 体 蛋白 L32 
磷酸 丙 糖 异 构 酶 
ax 一 珠 蛋 白 
细胞 角 蛋 白 内 A (cytokeratin endo A) 
甘油 醛 一 3 一 磷酸 脱 氢 酶 
肌 球 蛋白 轻 链 
鸦片 黑 素 皮质 激素 原 
核糖 体 蛋白 L7 
BR AEA L30 
核糖 体 蛋白 L32 
肿瘤 抗原 P53 
a— th A 
细胞 色素 C 


基因 的 数目 反 录 假 基因 的 数目 


1 
1 
2 
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Al Weiner “ , (1986), 


a\ 其 中 一 个 是 反 录 基因 。 


¢ iiss 


在 有 些 情 况 下 ,加工 后 假 基 因 的 数目 可 以 超过 其 有 功能 对 应 物 数 目 达 几 个 数量 级 .4/x 家 族 就 是 
一 个 这 样 的 例子 ,该 家 族 之 所 以 如 此 命名 ,是 因为 这 种 序列 中 含有 一 个 Alu 1 内 切 核酸 酶 的 特征 性 限 
制 位 点 .4zx 序列 长 约 为 300bp ,它们 属于 人 类 基因 组 中 一 个 超过 50 万 次 的 重复 序列 家 族 , 以 构成 基因 
组 的 5 一 6%% 而 引 人 注 目 。 

乌 卢 和 楚 迪 (Ullu 和 Tschudi, 1984) RHR, Alu 序列 实际 上 是 确定 7SL RNA 的 基因 的 加 工 后 假 基 
因 .7SL RNA 在 切除 分 泌 和 蛋白 质 的 信号 顺序 中 是 至 关 重 要 的 。 其 活性 基因 受 着 严格 限制 ,而 且 它 的 顺 
序 在 象 人 、 爪 蟾 以 及 果 蝇 这 样 一 些 分 岐 程度 很 高 的 生物 中 都 是 保守 的 .人 的 Alu 序列 是 从 7SL 序列 经 
过 一 系列 步 聚 ,包括 一 次 重复 ,两 次 缺失 和 多 次 核 苷 酸 蔡 换 (图 7 一 10a) 衍 生 而 来 的 .大 多 数 的 人 Alu 
序列 有 一 个 二 聚 体 结构 .人 基因 组 还 含有 许多 四 聚 体 4jx 序列 ,但 至 今 只 有 几 个 单 体 Alu 因子 曾 在 人 
EPMA PA AY Alu 等 价 物 如 1 家 族 , 几 乎 是 绝对 地 单 体 的 (图 7 一 10b)。 布 里 腾 等 (Brit- 
ten 等 ,1988) 将 第 一 个 单 体 出 现 的 时 间 定 在 哺乳 类 辐射 之 前 的 年 代 , 而 把 产生 二 聚 体 的 重复 所 处 的 年 
代 定 在 灵 长 类 谱系 建立 以 后 。 

如 果 一 个 反 录 假 基 因 保留 着 被 转录 的 能 力 , 则 其 后 可 能 会 有 一 个 倾 落 过 程 跟 随 , 藉 此 新 的 反 录 假 
基因 即 从 现存 反 录 假 基 因 的 RNA 转录 中 产生 出 来 .这 种 情况 曾 被 认为 在 4/x 家 族 中 发 生 过 (Bains， 
1986) 我们 注意 到 ,7SL 基因 是 被 RNA 多 聚 酶 下 转录 的 ,而 该 酶 则 并 不 需要 转录 区 外 的 启动 子 。 因 

此 , 某 些 Alu 序列 保留 了 完整 的 启动 子 并 且 连 续 不 断 地 被 转录 ,这 是 可 以 想象 到 的 .不 过 , 威 拉 德 等 
(Willard 等 ,1987) 和 布 里 滕 等 (Britten 等 .1988) 仅 认 出 了 Alu 序列 的 几 个 亚 家 族 。 布 里 滕 等 (Britten 
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图 7 一 10 Alu FP) HRA aA BAFHLURKEEP DARKE PISL RNA 基因 中 的 不 同 区 域 用 不 同 的 阴影 图 区 

别 , 以 强调 Alu 序列 中 的 缺失 和 重 排 。(A)n 表示 A 被 重复 mn 次 。 注 意 在 (a) 中 的 二 聚 体 结 构 和 在 (b) 中 的 单 体 结 构 。 | 
等 ,1988) 提 出 ,这些 亚 家 族 是 从 4 个 源 基 因 逐 步 衍 生 的 (图 7 一 11) 。 更 近期 衍生 出 来 的 亚 家 族 , 其 与 祖 
先 7SL 序列 在 顺序 上 的 分 岐 比 古老 一 些 亚 家 族 的 更 大 .所 以 结论 是 ,4zx 序列 不 是 直接 从 7SL 功能 基 

因 和 相生 而 来 ,而 是 从 少数 源 序列 孙 生 而 来 的 ,这 些 源 序列 则 是 从 7SL RNA 序列 经 过 许多 变化 步骤 而 
产生 的 。 这 四 种 源 基 因 各 在 这 一 时 刻 或 那 一 时 刻 起 着 4Lx 序列 的 主导 源 作 用 ,并 各 被 某 一 后 代 谱 系 所 
替代 。 固 定 的 连续 波 虽 不 在 突然 的 爆发 后 出 现 , 但 连续 的 亚 家 族 却 继续 在 基因 组 中 长 期 共存 ( 另 见 
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Quentin ,1988) 。 
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图 7 一 11 Au 序列 的 不 同 亚 家 族 间 在 已 判断 出 的 位 置 4 有 阿拉 伯 数 字 ) 上 的 突变 次 序 。 罗 马 数 字 指 示 在 不 同时 期 起 
着 Alu 序列 的 主导 源 作 用 的 连续 的 源 基 因 。 将 每 一 个 亚 家 族 与 其 前 面 一 个 区 别 开 来 的 替换 用 X 表示。 资料 自 Brit- 
ten 等 (1988) 。 

由 于 反 转 录 的 泛 有 性 ,哺乳 动物 的 基因 组 简直 是 处 在 反 录 序列 的 拷贝 的 困扰 中 。 绝 大 多 数 的 这 类 
拷贝 从 它们 整合 到 基因 组 中 时 起 就 是 无 功能 的 .而 且 , 这 样 一 些 序列 也 不 能 通过 基因 转变 而 轻易 地 复 
苏 , 因 为 它们 大 多 数位 于 距 其 亲本 功能 基因 很 远 的 染色 体位 置 上 (第 六 章 )。 一 个 有 功能 的 基因 座位 泵 
出 它 自己 的 有 缺陷 拷贝 .并 将 它们 散布 在 整个 基因 组 中 的 现象 ,可 以 与 火山 产生 岩浆 作 类 比 ,因此 该 


过 程 曾 被 命名 为 进化 的 维 苏 威 模式 (Vesuvian mode of evolution) (P. Leder ,在 Lewin ,1981 中 被 引用 )。 
加 工 后 假 基因 的 进化 


正如 前 面 所 说 的 ,一 旦 加 工 后 假 基 因 作 为 基因 组 中 的 一 种 染色 体 序列 而 存在 后 , 它 就 是 无 功能 的 
并 不 受 一 切 选 择 的 限制 .由 于 缺少 功能 ,所 以 假 基 因 受 两 种 进化 过 程 的 影响 CGraur 等 ,1989b)。 第 一 
种 涉及 点 突变 的 极 迅速 的 积累 。 这 种 积累 最 终 会 抹 去 假 基 因 与 其 功能 同 源 物 间 的 顺序 相似 性 ,因为 后 
者 的 进化 要 缓慢 得 多 。 假 基因 的 核 苷 酸 组 成 将 变 得 与 其 无 功能 的 近邻 越 来 越 相 象 ,以 至 最 终 它 将 ` 混 
人? 其中。 这 一 过 程 曾 被 称 为 组 成 同化 (compositional assimilation) ) 。 

第 二 种 进化 过 程 的 特征 是 ,与 其 功能 基因 相 比 , 假 基 因 会 变 得 越 来 越 短 .这 种 长 度 缩短 (length 
abridgement) 是 由 于 缺失 超过 插 人 而 造成 的 . 曾 有 人 估计 ,哺乳 动物 的 加 工 后 假 基 因 在 大 约 4 亿 年 的 
时 间 里 失去 了 约 一 半 的 DNA.。 这 一 过 程 是 如 此 地 缓慢 ,以 至 在 人 的 基因 组 中 还 含有 那些 在 其 非常 还 
古 的 祖先 中 发 现 的 假 基 因 DNA 的 主要 部 分 就 是 一 个 很 好 的 例子 .显然 ,这 些 古 老 的 假 基因 时 至 今日 
几乎 已 经 失去 了 与 其 从 之 发 端的 功能 基因 的 一 切 相 似 性 。 

总 而 言 之 ,看 来 加 工 后 基因 产生 的 速率 比 它们 通过 缺失 而 被 抹 去 的 速率 要 快 得 多 .所 以 结论 是 ， 
缩短 的 过 程 进 行 得 太 慢 了 ,以 至 于 无 法 抵消 继 不 断 的 维 苏 威 式 的 篆 击 之 后 出 现 的 基因 组 大 小 上 的 增 
加 (第 八 章 ;Graner 等 ,1989b) 。 
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7.4 转 座 对 和 宿主 基因 组 的 影响 


转 座 和 反 录 转 座 可 能 对 基因 组 的 大 小 和 结构 有 着 深远 的 影响 。 尤 其 是 ,可 转 座 因 子 已 被 看 成 是 
“自私 DNA”(Cselfish DNA) 的 最 好 例子 ;这 里 自私 DNA 可 能 不 带 给 宿主 任何 利益 , 却 因为 它 比 基因 ， 
组 的 序列 增殖 迅速 而 能 在 基因 组 中 传播 (Doolittle 和 Sapienza,1980;Orgel and Crick ,1980) 。 为 此 缘 
故 , 转 座 能 极 大 地 增加 基因 组 的 大 小 .这 种 效应 将 在 第 八 章 中 探讨 。 这 里 ,我 们 将 只 关心 可 转 座 因子 影 
响 基 因 进 化 和 表达 的 方式 。 

第 一 ,如 以 上 所 讲 到 的 ,细菌 中 的 转 座 子 常常 带 有 能 给 予 携带 者 以 抗生素 抗 性 或 其 他 抗 性 的 基 
因 。 于 是 , 转 座 子 也 许 能 使 该 宿主 物种 在 某 种 逆境 中 生存 。 

第 二 ,一 个 基因 的 表达 也 许 会 因为 可 转 座 因子 存在 于 该 基因 之 中 或 其 邻近 而 改变 。 情 况 最 简单 的 
是 ,可 转 座 因子 插 人 到 一 个 为 蛋白 质 编码 基因 的 编码 区 中 ,这 将 极 有 可 能 改变 阅读 框架 ,因而 可 能 会 
有 激烈 的 表 型 效应 。 类 似 地 ,可 转 座 因 子 的 切 离 可 能 是 不 精确 的 ,结果 就 会 导 至 碱 基 的 增加 或 缺失 。 然 
而 ,也 有 预料 不 到 的 效应 。 例 如 ,一 个 可 转 座 因子 也 许 会 含有 调控 因子 , 象 启 动 子 ,这 就 会 影响 邻近 基 
因 的 转录 频率 .事实 上 , 反 录 病毒 的 LTR 中 常常 含有 很 强 的 增强 子 ,它们 将 对 邻近 基因 的 表达 产生 很 
大 的 影响 .类似 地 ,酿酒 酵母 Saccharomyces cerevisial 中 的 了 y( 表 示 “transposon yeast”) 因子 已 知 能 增 
加 下 游 基 因 的 表达 。 这 在 某 些 特殊 环境 中 可 能 是 有 利 的 ,虽然 在 大 多 数 情 况 下 ,由 这 类 变化 造成 的 代 
谢 不 平衡 极 有 可 能 是 有 害 的 .含有 拼接 给 体 或 受 体 的 可 转 座 因 子 , 即 使 被 挨 人 到 基因 的 非 编 码 区 ,如 
某 一 内 含 子 之 中 ,也 有 可 能 会 影响 原初 RNA 转录 本 的 加 工 。 

第 三 ,许多 可 转 座 因子 能 促成 大 型 的 基因 组 重 排 . 倒 位 、 易 位 ,重复 以 及 大 段 的 缺失 和 揪 和 人 可 以 经 
可 转 座 因 子 的 中 介 而 发 生 。 这 些 重 排 能 以 转 座 的 直接 后 果 发 生 ( 即 ,通过 DNA 片段 从 一 个 基因 组 位 
置 向 另 一 位 置 的 运动 ) ,并 且 能 改变 它们 进行 表达 时 的 环境 。 作 为 转 座 的 结果 , 若 两 个 先前 相互 间 很 少 
相似 性 的 序列 现在 能 共享 某 一 相似 的 可 转 座 因子 ,以 至 它们 间 有 可 能 进行 不 等 价 交换 , 则 随后 将 会 出 
现 较 间 接 的 效应 .图 7 一 12 示 意 了 ,由 于 复 本 Ale 序列 存在 于 低 密度 脂 蛋 白 受 体 基 因 的 外 显 子 5 侧面 的 
内 含 子 中 ,从 而 促成 了 一 次 不 等 价 交换 事件 ,而 这 样 一 次 事件 又 是 怎样 导 至 一 个 缺少 该 外 显 子 的 突变 
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图 7 一 12 (KGL RALHKAAP HASH RR PLS ARBURATHPURS ASF PH Alu FAAS 
Bh A BEAD) 40 tw AA) RRR Alu STR AAR SR) TE CE 
的 。 设 想 的 交换 位 置 用 X 指示 。 重 组 后 的 缺失 (观察 到 的 ) 和 插入 (推测 的 ) 产 物 被 描绘 成 FH626 一 a Fe FH—?, 42 F 
箭头 之 下 。 自 Hobbs 等 (1986) 。 
型 基因 的 产生 的 (Hobbs 等 ,1986)。 在 低 密 度 脂 蛋白 基因 中 ,由 同样 机 制造 成 的 外 显 子 14 的 缺失 也 已 
被 观察 到 (Lehrman 等 ,1986)。 对 这 些 缺 失 呈 纯 合 的 病人 在 血液 中 有 高 水 平 的 胆固醇 (高 胆固醇 血 
fie) . PA Alu 因子 间 的 重组 还 被 证 明 是 造成 患 腺 苷 脱 氨 酶 缺陷 症 病 人 的 腺 昔 脱 氨 酶 基因 缺失 启动 子 
和 第 一 个 外 显 子 的 原因 (Markert 等 ,1988) .一 般 而 言 , 对 于 所 有 含 Alu 重复 序列 的 区 域 , 基 因 组 不 稳 
定性 都 已 得 到 证 实 (Calabretta 等 ,1982) 。 
第 四 ,有 证 据 表 明 , 某 些 可 转 座 因子 可 能 会 造成 突变 率 增 加 。 和 全 含有 可 转 座 因 子 Tz10 的 五. 
coli 品系 被 发 现 插入 速率 升 高 了 (Chao 等 ,1983) 。 在 大 多 数 情 况 下 ,这 种 性 状 对 携带 者 来 说 将 是 有 害 
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的 。 然 而 ,在 严峻 的 环境 压力 下 ,突变 率 提高 也 有 可 能 是 有 利 的 ,因为 有 些 突变 也 许 能 更 好 地 适应 新 的 
环境 ,而 它们 的 携带 者 也 将 比 非 携带 者 有 更 高 的 适合 度 。 


7.5 杂 种 劣势 


果 蝇 中 的 杂种 劣势 (hybrid dysgenesis) 是 由 一 些 相 关 的 异常 遗传 性 状 造成 的 症候 群 ,这 些 性 状 在 
某 些 相互 作用 的 品系 间 的 一 个 杂种 类 型 中 自发 地 诱 生 出 来 ,但 在 相反 方向 交配 的 杂种 中 则 通常 不 会 
出 现 CSved，1976; Kidwell 和 Kidwel,1976) 。 杂 种 劣势 曾 引起 分 子 生物 学 家 和 进化 生物 学 家 的 浓厚 
兴趣 ,因为 已 经 发 现 它 是 由 可 转 座 因子 造成 的 , 且 它 的 主要 特征 是 产生 阻止 品系 间或 群体 间 杂 交 的 屏 
障 ,而 这 种 屏障 则 曾 被 推测 是 物种 形成 的 一 个 原因 ( 见 后 ) 。 


图 7 一 13 果 蝇 中 的 杂种 劣势 .Ca)M 品系 内 交配 和 (b) 己 品系 内 交配 产生 正常 后 代 。(c) 正 常 后 代 也 能 在 M 雄 体 和 
已 肉体 的 杂交 中 产生 。(d) 在 尸 雄 体 和 M 上 肉体 的 杂交 中 ,产生 了 筋 势 的 后 代 , 它 们 中 许多 是 不 育 的 。 
果 蝇 中 有 几 种 杂种 劣势 系统 ,下 面 我 们 将 仅 对 其 中 之 一 , 己 一 M 系统 进行 探讨 。 杂 种 劣势 的 不 对 


称 性 如 图 7 一 13 所 示 . 当 一 个 尸 品系 的 雄 体 与 一 个 M 品系 的 肉体 交配 时 ,其 后 代 是 劣势 的 ;而 在 相反 


方向 的 交配 中 ,其 后 代 则 是 正常 的 .P 一 M 系统 的 劣势 性 状 包括 :(1) 某 些 代 体 在 一 定 的 条 件 下 生殖 腺 
发 育 不 全 ,(2) 在 雄 体 中 出 现 重组 (在 果 蝇 中 重组 通常 被 限制 在 肉体 中 ,所 以 这 是 一 种 非 自然 的 现象 )， 
(3) 染 色 体 发 生 断 裂 , (4) 偏 离 了 备 德 尔 传递 比率 ( 即 , 相 对 于 尸 染 色 体 而 言 M 染色 体 传 给 后 代 的 倾 ， 
向 性 要 大 一 些 ), 和 (5) 出 现 高 突变 频率 。 

P 一 M 系统 劣势 的 原因 来 自 一 个 被 称 为 已 因子 的 可 转 座 因子 的 家 族 (图 7 一 3)。 在 尸 品系 中 , 基 
因 组 中 有 30 一 50 个 尸 因子 ,但 它们 中 许多 都 可 能 含有 缺失 .它们 分 布 于 所 有 人 染色体 中 。 虽 然 在 有 些 品 
系 中 , 转 座 表现 得 有 点 偏爱 X 染色 体 .M 品系 则 不 带 己 因子。 杂种 劣势 系统 的 不 对 称 性 被 认为 是 这 样 
造成 的 ,由 于 母性 遗传 ,已 雌 体 XM 雄 体 交配 的 F1 子 代 中 存在 着 已 因 子 编码 的 抑制 物 , 而 相反 方向 
的 交配 M 肉体 又 已 雄 本 ,其 Fl1 子 代 中 则 缺少 这 种 抑制 物 .P 因子 可 以 在 从 母系 的 细胞 质 中 得 到 缺乏 
该 抑制 物 的 种 系 细胞 中 转 座 , 杂 种 劣势 是 与 这 种 转 座 相 关联 的 .在 杂种 劣势 的 背景 下 ,细胞 质 中 抑制 
物 的 存在 与 否定 义 了 合子 形成 后 的 反应 类 型 ,因而 被 命名 为 细胞 型 (cytotype)。 在 抑制 物 存在 下 , 己 因 
子 的 转 座 可 能 被 完全 或 部 分 地 抑制 .正常 情况 下 体 细胞 中 不 发 生 已 因子 的 转 座 , 因 为 体 细胞 中 编码 
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区 中 的 第 3 个 内 含 子 不 象 在 种 系 细胞 中 那样 会 被 切 离 。 
基 德 韦 尔 (Kidwell,1983) 观 察 到 的 一 个 有 趣 现 象 涉 及 带 有 书 的 品系 的 分 布 。 在 1950 年 以 前 收集 
的 任何 D. melanogaster 果 蝇 品系 中 都 未 曾 观 察 到 尸 性 状 , 而 随后 收集 到 的 品系 则 表现 出 己 的 频率 增 
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野生 起 源 的 年 份 
图 7 一 14 自然 群体 中 M 品系 ( 即 无 书 因 子 的 品系 ) 频 率 变化 ,(a) 在 北美 和 南美 的 自然 群体 中 ,(b) 在 欧洲 、 非 洲 和 
中 东 的 自然 群体 中 ,(c) 在 澳洲 和 远东 的 自然 群体 中 。 箭 头 指示 已 品系 的 第 一 次 出 现 。 注 意 ,M 群体 的 比例 下 降 最 初 
出 现在 美洲 大 陆 , 只 是 后 来 才 在 其 他 大 陆 出 现下 降 。 自 Kidwell(1983) 修 改 而 成 。 
加 和 寿命 降低 (图 7 一 14) 。 另 一 个 劣势 系统 T 一 尺 , 已 得 到 类 似 的 观察 结果 。 已 有 两 种 假说 被 提出 来 ,以 
解释 已 因子 的 分 布 。 恩 格 斯 (Engels,1981b) 提 出 ,自然 界 中 大 多 数 品 系 是 书 型 的 ,但 它们 在 实验 室 群 
体 中 有 失去 该 转 座 子 的 倾向 。 第 二 种 假说 则 设想 , 忆 转 座 子 是 近来 才 导 和 D. melanogaster 群体 的 , 随 
后 己 因 子 在 以 前 的 M 群体 中 迅速 传播 (Kidwell,1979) .有 几 个 原因 可 以 说 明 为 什么 第 三 种 假说 看 来 
要 更 合理 一 些 。 首 先 , 带 有 书 的 实验 室 品系 曾 被 监测 了 近 15 年 ,并 未 失去 它们 的 书 特 性 其 次 ,在 已 品 
系 的 分 布 上 看 来 有 一 个 地 理 渐 变 群 ,北美 群体 表现 得 比 某 些 欧洲 .非洲 和 亚洲 品系 更 早 地 带 有 己 特 
性 。 最 后 ,现在 已 有 证 据 表 明 , 刀 . melanogaster § KO M—-P+RRKAH ICH WHA BRE S PAF 
( 见 第 117 页 ) 


7.6 转 座 与 物种 形成 


物种 形成 (speciation) 或 分 枝 进 化 (cladogensis) ( 即 从 一 个 亲本 物种 产生 两 个 或 多 个 物种 ) 是 最 
重要 的 进化 过 程 之 一 。 遗 憾 的 是 ,在 分 子 水 平 上 , 它 也 是 我 们 了 解 得 最 少 的 进化 过 程 之 一 。 我 们 不 知道 
新 物种 是 通过 什么 方式 而 从 老 物 种 中 产生 的 。 我 们 所 知道 的 只 是 ,物种 形成 的 过 程 需要 在 两 个 属于 同 
一 物种 的 群体 间 产 生生 殖 障 碍 ,使 得 它们 就 不 再 能 杂交 .杂种 劣势 有 一 阵子 曾 被 认为 是 物种 形成 过 程 
的 早期 阶段 ,起 着 属 同一 物种 的 不 同 群 体 间 交配 后 产生 生殖 隔离 的 机 制 的 作用 .事实 上 ,姐妹 种 也. 
melanogaster 和 D. simulans 间 杂 交 产 生 的 杂种 不 育 就 与 劣势 非常 类 似 ( 例 如 ,性 腺 发 育 不 良 , 分 离 扭 
曲 等 ) 。 

不 过 ,此 观点 有 几 个 问题 有 待 解 决 。 第 一 ,虽然 杂种 表现 出 适合 度 降 低 , 因 而 从 生殖 角度 看 是 部 分 
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被 隔离 的 ,但 已 因子 在 种 系 细胞 中 的 转 座 实际 上 保证 了 大 多 数 传 给 杂种 的 染色 体 将 带 有 POA. 
细胞 型 也 最 终 会 变 成 一 型 。 于 是 , 倘 大 杂 种 的 适合 度 降 低 不 是 太 大 的 话 , 则 书 因 子 将 会 传 遍 整个 群 
体 . 事 实 上 ， 因为 有 效 的 生殖 隔离 ,杂种 最 终 将 是 几乎 完全 不 育 的 。 第 二 ,已 因子 有 作为 传染 因子 而 从 

一 个 个 体 向 另 一 个 个 体 水 平 转 座 的 能 力 ( 见 第 117 页 原版 ) .于 是 ,整个 群体 可 能 会 被 已 迅速 接管 ,这 
样 杂 种 劣势 看 来 在 自然 界 中 只 能 维持 非常 短 的 时 期 .事实 上 ,许多 果 蝇 种 已 知 其 所 有 个 体 和 所 有 群体 
iA PAF RA 已 因 子 , 因 而 杂种 劣势 将 不 会 在 这 些 种 中 的 任何 一 种 中 出 现 。 最 后 ,就 我 们 所 知 ， 
杂种 劣势 限制 在 果 蝇 范围 ,因而 可 能 并 不 代表 自然 界 中 的 普遍 现象 .即使 在 果 蝇 中 ,也 没 发 现 易 动 因 
子 与 阻碍 姐妹 种 间 基 因 流动 有 关 的 证 据 。 

由 于 可 转 座 因子 的 发 现 ,许多 其 他 关于 由 转 座 导 至 物种 形成 的 机 制 也 在 文献 中 出 现 。 例如 , 曾 有 
人 提出 ,一 个 群体 中 的 含有 调控 序列 的 因子 , 它 的 大 规模 复制 型 转 座 可 能 会 引起 所 谓 基因 组 的 遗传 重 
HE (genetic resetting ) , 夭 此 许多 基因 将 会 经 受 一 种 新 的 调控 形式 .这 样 一 个 群体 显然 将 变 得 与 保留 着 
旧 调 控 形 式 的 群体 发 生生 殖 隔 离 . 另 一 种 说 法 则 求助 于 机 制 不 相 容 性 (mechanical incompatibility) ，， 
它 也 是 由 大 规模 复制 型 转 座 所 造成 的 。 在 这 种 情况 下 ,假定 一 个 群体 中 的 可 转 座 因子 曾 发 生 增 殖 ,并 
达到 使 染色 体 大 小 出 现 显著 增 大 的 程度 。 于 是 ,从 一 个 亲本 那里 继承 大 染色 体 而 从 另 一 个 那里 得 到 小 
染色 体 的 杂种 生物 体 ， 在 减 数 分 裂 期 间 将 会 经 历 染色 体 配 对 上 的 困难 ， 而 这 裤 有 可 能 会 造成 不 到 遗 
城 的 是 ， 迄今 为 止 所 提 及 的 物种 形成 模型 ， 没有 一 个 曾 得 到 经 验 数 据 的 支持 。 


7.7 可 转 座 因子 拷贝 数 的 进化 动力 学 


一 个 基因 组 中 的 可 转 座 因子 的 拷贝 由 3 个 因素 所 决定 .Cl)u, 一 个 可 转 座 因 子 产生 一 个 新 基因 组 
拷贝 的 概率 ( 即 复 制 型 转 座 的 概率 ),(2)v, 该 因子 被 切 离 的 概率 ,以 及 (3) 对 抗 增 加 可 转 座 因子 在 基因 
组 中 的 数目 的 选择 强度 .关于 果 蝇 D. melanogaster 群体 中 几 个 可 转 座 因 子 的 u Av AL 已 经 由 实验 
得 出 , 转 座 频率 被 发 现在 不 同 可 转 座 因子 间 有 些 变化 ， 但 平均 起 来 则 处 在 每 因子 每 世代 10- “这 一 数量 
级 。 切 离 频 率 大 约 要 低 一 个 数量 级 (Charlesworth 和 Langley,1989) .因此 ,在 没有 对 抗 可 转 座 因 子 转 . 
座 的 选择 的 情况 下 ,基因 组 中 的 拷贝 数 预期 将 无 限制 地 增加 。 

如 果 可 转 座 因子 的 数目 维持 在 一 个 平衡 位 置 上 ,这 可 能 是 一 个 在 自然 界 不 成 立 的 假定 ,那么 , 选 
择 就 必须 发 生 作用 以 对 抗 拷 贝 数 的 增加 :在 最 简单 的 决定 性 模型 中 ,我们 假定 ,个 体 的 适合 度 w 将 随 
拷贝 数 n 的 增加 而 降低 .此 假定 的 合理 性 是 ,可 转 座 因 子 的 插 人 频频 地 改变 着 邻近 基因 的 表达 ; 随 着 
可 转 座 因 子 的 数目 的 增加 ， 基因 表达 出 现 有 害 变 化 的 概率 也 会 增加 。 可 以 证 明 , 只 要 w 值 随 着 n 的 增 
加 而 降低 , 则 不 管 n 和 交 间 的 精确 关系 如 何 ， PE TREE Te > 可 转 座 因 子 的 个 体 而 言 的 
平均 适合 度 为 a, ta: 

w= ee | 和 Kee 
(Charlesworth ,1985) 。 

4£ FR WD. melanogaster 的 情况 中 ,有 约 50 个 转 座 子 家 族 ， 每 个 家 族 平 均 在 基因 组 中 出 现 10 次 
(Finnegan 和 Fawcett,1986) ,于 是 n 王 500。 因 为 比 u 至 少 小 一 个 数量 级 ,所 以 u 一 Yu 一 10 +。 解 等 
式 7.1, 我 们 得 只 =0. 95。 于 是 ,适合 度 上 的 降低 为 s 王 1 一 0.95 王 0.05。 由 等 式 7. 1 给 出 的 平衡 的 稳定 
性 ,要 求 适合 度 的 对 数 衰减 比 n 的 线性 增加 更 陡峭 (Charlesworth,1985) .不 过 ,为 了 运算 简单 ,我 们 候 
定 呈 线性 ,那么 ,每 增加 一 个 转 座 子 适合 度 的 降低 近似 为 0.05/500 王 10“。 这 样 小 的 选择 系数 本 质 上 
意味 着 ,一 个 生物 体 中 的 可 转 座 因子 的 拷贝 数 主要 是 由 随机 遗传 漂 变 所 决定 的 .如 果 一 个 生物 体 含 有 
数目 更 大 的 可 转 座 因 子 , 甚 至 在 果 蝇 中 可 转 座 因子 数 大 大 超过 500 的 可 能 性 也 是 存在 的 (Rubin， 
1983) ,那么 ,一 个 转 座 子 对 适合 度 的 效应 也 许 要 比 上 面 所 得 到 的 更 小 。 

关于 对 抗 拷贝 数 增 加 的 选择 的 一 个 可 采用 形式 是 自我 调控 转 座机 制 , 即 转 座 的 频率 随 拷贝 数 的 
增加 而 降低 ,或 切 离 的 频率 随 拷 贝 数 的 增加 而 增加 ( 见 Chenlesworth # Langley ,1989). 


7.8 水 平 基 因 转 移 


水 平 基因 转移 (horizontal gene transfer) 被 定义 成 遗传 信息 从 一 个 基因 组 向 另 一 个 基因 组 ,特别 
是 在 两 个 物种 之 间 的 转移 .这 个 术语 的 提出 是 为 了 把 这 类 转移 与 通常 的 “垂直 转移 ”区 别 开 来 ,后 者 则 
是 亲 代 把 遗传 信息 传 给 子 代 的 转移 。 水 平 基因 转移 要 求 ,(1) 在 各 生物 体 和 各 细胞 间 转 输 遗 传 信息 的 
交通 工具 ,和 (2) 将 外 源 DNA 片段 插入 宿主 基因 组 中 的 分 子 机 制 。 反 录 病 毒 能 完成 这 两 个 任务 ,因为 
它们 既 能 把 染色 体 的 DNA 挫 和 到 它们 的 基因 组 中 ,又 能 跨越 物种 界线 (Benveniste 和 Todaro,1976; 
Bishop ,1981) 。 在 转 座 子 以 及 其 他 类 型 的 DNA 中 介 的 转 座 中 ,跨越 细胞 的 传输 必须 由 一 个 传染 因子 
来 提供 ,如 质粒 事实 上 ,许多 自然 界 中 出 现 的 质粒 都 含有 可 转 座 因 子 , 这 些 因子 可 以 从 质粒 上 离开 而 
向 细菌 染色 体 移动 ,也 可 相反 方向 地 移动 。 

通过 发 现 某 一 具体 基因 的 系统 发 育 分 布 中 的 显著 不 连续 性 ,也 许 能 检 出 一 个 水 平 基因 转移 事件 。 
例如 ,细菌 Salmonella typhimurium 含有 一 个 类 组 蛋白 基因 , 据 我 们 所 知 它 在 其 他 细菌 中 没有 对 应 物 
(Higgins 和 Hillyard,1988) 。 当 发 现 基 因 系 统 发 育 和 物种 系统 发 育 之 间 明 显 地 存在 矛盾 时 ,特别 是 顺 
序 类 似 性 看 来 反映 了 地 理 上 的 近似 而 不 是 系统 发 育 上 的 亲缘 性 时 ,或许 也 可 以 怀疑 有 水 平 基因 转移 。 
作为 例子 ,我们 考虑 一 下 图 7 一 15a 中 的 系统 发 育 树 .假定 B 从 A 那里 分 岐 后 ,发 生 了 一 个 DNA 片段 
从 物种 也 向 物种 C 的 转移 。 在 除 发 生 了 水 平 转移 的 基因 外 的 任何 基因 的 顺序 比较 的 基础 上 ,我 们 可 
望 得 到 一 个 正确 的 物种 间 系统 发 育 关 系 。 对 比 之 下 ,如 果 我 们 采用 发 生 了 水 平 转移 的 DNA 片段 , 则 
我 们 将 得 到 如 图 7 一 15b 中 那样 的 错误 树 。 不 过 ,我 们 也 注意 到 , 除 水 平 基因 转移 外 还 有 别 的 因素 也 能 


造成 物种 树 和 基因 树 之 间 的 矛盾 (第 五 章 )。 
(a) (b) 


基因 转移 


B a: A B 
图 7 一 15 水 平 基因 转移 的 情况 下 系统 树 的 构建 Ca) 真实 树 ,(b) 推 测 树 。 


两 类 序列 能 被 水 平地 转移 : (1) 从 可 转 座 因子 衡 生出 的 序列 ,和 (2) 基 因 组 序列 ,基因 组 序列 的 水 
平 基因 转移 的 例子 中 ,很 少 有 已 被 令 人 信服 地 证 实 了 的 。 许 多 原来 这 样 声 称 的 例子 ,后 来 发 现 并 不 能 
得 到 分 子 证 据 的 支持 .而 且 , 我 们 注意 到 ,一 个 发 生 了 水 平 转移 的 基因 在 宿主 中 保留 其 功能 性 的 情况 
是 很 罕见 的 ,预期 比 一 个 在 同一 物种 内 从 一 个 基因 组 位 置 到 另 一 个 位 置 转移 的 基因 ( 见 第 111 页 ) 更 少 


病毒 基因 从 狮 狂 到 猫 的 水 平 转移 


脊 椎 动物 基 因 组 中 含有 许多 与 反 录 病毒 同 源 的 序列 .这 些 序列 是 真 核 生物 细胞 核 DNA 的 正常 
组 份 , 称 为 内 源 性 反 录 病毒 序列 (endogeneous retroviral sequences) 或 病毒 基因 (virogene) .有 几 个 内 源 
性 反 录 病毒 序列 在 肴 椎 动物 的 种 间 转 移 的 例子 (综述 见 Benveniste, 1985). H+ — fil 53% A Bb BEY c 
型 病毒 基因 有 关 ( 图 7 一 16)。 

与 独 独 的 病毒 基因 同 源 的 序列 已 在 所 有 古 世 界 猴 的 细胞 DNA 中 检 出 。 它们 间 的 顺序 类 似 性 是 
与 物种 间 的 分 类 学 关系 紧密 相关 的 。 于 是 ,该 病毒 基因 在 灵 长 类 中 至 少 存在 了 3 千 万 年 .有趣 的 是 6 种 
RM (Felix catxs) 亲 缘 关 系 密 切 的 猫 也 含有 这 一 序列 ,虽然 在 亲缘 关系 较 远 的 猫 科 动 物 、 象 狮 , 豹 和 
短 尾 猫 , 以 及 任何 其 他 食肉 动物 中 ,都 不 存在 这 一 序列 .所 以 ,这 一 序列 极 有 可 能 是 在 过 去 某 一 时 刻 在 
物种 间 水 平 转移 的 。 水 平 传递 的 年 代 和 方向 可 从 两 类 资料 中 推出 :(1) 顺 序 类 似 性 和 (2) 古 地 质 学 信 
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猫 科 


2 
其 他 食肉 动物 “ 

图 7 一 16 十 世界 猴 和 猫 的 系统 发 育 树 。 含 有 型 病毒 基因 的 物种 用 实 线 标 出 。 来 自 狂 独 和 狮 尾 独 狂 的 c 型 病毒 基 
因 展 现 出 与 猫 的 c 型 病毒 基因 有 最 大 的 类 似 性 。 因 此 ,在 大 约 1 千 万 前 可 能 发 生 了 一 次 水 平 基因 转移 ,该 转移 是 从 
狂 狂 和 狮 尾 狂 狂 的 祖先 到 与 狮 \ 鹏 和 猎豹 等 的 谱系 分 岐 后 的 现代 猫 的 祖先 。 自 Benveniste (1985) 修 改 而 成 。 
息 。 

所 有 含 狂 独 病毒 基因 的 猫 种 都 来 自 地 中 海地 区 ,而 来 自 东 南亚 、 新 世界 和 非洲 的 猫 科 动物 则 缺少 
该 序列 .因此 ,转移 发 生 在 猫 科 动物 的 大 辐射 之 后 , 且 被 限制 在 一 个 地 理 区 域 中 。 这 一 结论 指出 ,水 平 
基因 转移 的 年 代 在 500 一 1000 万 年 前 。 传 递 方向 则 可 这 样 推出 :一 方面 考虑 该 序列 在 灵 长 类 中 的 分 布 ， 
另 一 方面 考虑 它 在 猫 类 中 的 分 布 。 因 为 所 有 古 世 界 猴 都 具有 该 病毒 基因 ,而 只 有 几 种 猫 才 具 有 该 基 
因 . 所 以 ,只 能 假定 猫 类 是 从 儿 独 那里 获得 该 序列 ,而 不 是 相反 ,这 才 是 合理 的 .这 一 结论 在 考虑 到 以 
下 事实 后 得 到 强化 : 猫 类 与 3 种 独 独 (Pazio cynoce phalus, P. papio 和 已 .haxozacdzyas) 和 亲缘 关系 密切 
AY Bi FE Bb Bi (Theropithecus gelada) 中 的 病毒 基因 ,它们 的 相似 程度 比 猫 类 与 任何 其 他 灵 长 类 序列 的 
相似 程度 要 更 高 一 些 . 因 此 ,该 序列 一 定 是 独 卯 和 狮 尾 独 狮 与 山 灰 分 岐 后 不 久 而 从 它们 的 祖先 转移 到 
猫 类 中 去 的 (图 7 一 16)。 从 对 独 狂 的 研究 中 得 出 的 年 代 与 从 对 猫 类 的 研究 中 得 出 的 年 代 一 致 得 相当 
 . 


尸 因子 在 果 蝇 的 种 间 的 水 平 转移 


水 平 基因 转移 的 另 一 个 例子 与 刀 . melanogaster 中 的 书 因 子 有 关 。 正 如 前 面 所 讲 的 ,在 近 40 年 的 
时 间 里 已 因子 已 迅速 传 遍 了 D. melanogaster 的 自然 群体 ( 见 第 114 页 )。 而 己 因 子 不 存在 于 与 
melanogaster 亲缘 关系 很 近 的 一 些 种 , 象 D. mauritania,D. sechellia, D. simulans 和 D. yakaba 等 之 中 。 
那么 这 些 因子 是 从 哪里 来 的 呢 ? 丹尼尔 斯 等 (Daniels 等 ,1990) 曾 对 成 百 种 果 蝇 进行 了 普查 ,结果 表 
明 , 除 D. melanogaster 外 ,zzelazogaster 类 亚 组 的 任何 其 他 种 中 都 未 发 现 已 序列 .相反 ,亲缘 关系 下 远 
的 willistoni 24 Fl saltans 组 的 所 有 种 都 含有 书 因子 和 类 尸 因 子 。 尤 其 是 ,D， willistoni 的 己 因 子 被 发 现 
除了 一 个 碱 基 蔡 换 外 完全 等 同 于 D. melanogaster 中 的 因子 ,这 指示 D. willistoni 在 P A ¥% 2!) D. 
melanogaster 的 水 平 基 因 转 移 中 ,起 着 供 体 物种 的 作用 。 

有 几 个 原因 使 得 我 们 怀疑 这 种 水 平 基因 转移 是 最 近 才 发 生 的 .首先 ,来 自 刀 .aelanogaster 和 来 目 
D. willistoni 的 书 序 列 间 的 接近 等 同 ,表明 发 生 分 岐 的 时 间 非 常 短 .其 次 ,来 自 地 理 位 置 相距 很 还 处 的 
D. mmzelanogaster, 它 们 的 书 序 列 间 几乎 没有 遗传 变异 性 ,这 指示 自己 因子 导入 万 .melanzogaster 以 来 时 
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间 还 很 短 ,以 至 还 来 不 及 积累 遗传 变异 性 .最 后 ,已 因子 在 也. melanogaster 中 出 现 的 地 理 模 式 , 以 美洲 
大 陆 中 的 群体 最 先 获 得 它 ,看 来 它 指示 着 涉及 了 一 次 非常 近期 的 侵 和 人 事件 ,时 间或 许 在 近 50 年 之 内 。 


习题 


1. 反 录 因 子 和 反 录 序列 间 的 差异 是 什么 ? 

2. 给 出 一 个 基因 组 序列 ,你 怎么 能 讲 出 它 是 不 是 一 个 反 录 序列 呢 ? 

3. 怎样 才能 将 加 工 后 假 基因 和 未 加 工 假 基因 加 以 区 别 ? 

4. 大 多 数 加 工 后 假 基因 都 是 “垂死 者 ”。 请 解释 ,为 什么 这 一 条 件 使 它们 成 了 推测 点 突变 模式 的 极 
好 材料 ( 见 第 四 章 和 Li 等 ,1984) 。 

5. 解释 为 什么 反 录 基因 很 少见 。 

6. 为 什么 Alu 序列 在 人 类 和 其 他 灵 长 类 的 基因 组 中 含量 会 如 此 丰富 ? 

7. Alu 序列 曾 被 认为 是 有 功能 的 ,但 现在 却 普遍 相信 它们 是 加 工 后 假 基 因 。 在 此 假说 下 ,4zx 序列 
应 该 象 其 他 假 基 因 那 样 迅 速 地 进化 。 那 么 , 表 7 一 3 中 的 数据 与 这 一 假说 相 容 吗 ? 

表 7 一 3 4/x 序列 之 间 以 及 1 一 珠 蛋 自 假 基因 之 间 顺 序 岐 化 的 程度 


百分比 岐 化 度 
物种 对 一 一 
Alu 序列 7 BEA 
AM BBE De 2 lak 1.7 


AM KBE 3.7+1.9 ail 
% 4 A Koop 等 (1986a) 和 Li 等 (1987a) 
a. 7 个 垂直 相关 的 序列 被 用 来 计算 平均 值 和 标准 偏差 。 
8. 试 列 举 转 座 对 宿主 可 能 产生 的 有 利和 不 利 效应 。 
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8 基因 组 的 组 织 化 和 进化 


关于 基因 组 的 组 织 化 和 进化 的 讨论 应 该 包括 3 个 不 同 的 课题 .第 一 个 是 基因 组 大 小 ,这 在 不 同 生 
物 间 变 化 极 大 .这 种 变化 是 如 何 形成 的 ?增加 和 降低 基因 组 大 小 以 产生 这 种 变化 的 机 制 是 什么 ?第 二 
个 是 基因 组 中 的 遗传 信息 。 基 因 组 主要 是 由 基因 的 DNA 构成 的 吗 ? 还 是 主要 是 由 非 基 因 的 序列 构成 
的 ?基因 组 中 有 许多 重复 序列 吗 ? 而 如 果 是 这 样 那么 重复 序列 的 染色 体 分 布 模式 是 什么 ? 非 基因 部 分 
有 功能 吗 ?或 者 它 只 是 "废物 ?第 三 个 课题 涉及 基因 组 的 核 苷 酸 组 成 。 基 因 组 的 不 同 区 域 中 在 组 成 上 
有 蜡 质 性 吗 ? 什 么 机 制 使 核 苷 酸 在 组 成 方面 造成 区 域 性 差异 ? 


二 


单 倍 体 基因 组 , 象 在 精子 细胞 核 中 的 那样 ,其 DNA 的 量 称 基 因 组 大 小 (genome size) 或 C 值 (C 
value) ,这 里 C 来 自 “constant”( 常 数 ) 或 “characteristic”( 特 征 ) ,表示 单 倍 体 基 因 组 的 大 小 在 任何 一 个 
物种 中 都 是 相当 恒定 的 这 样 一 个 事实 。 反 之,C 值 在 原核 生物 和 真 核 生 物 的 各 物种 间 则 变化 幅度 极 
二 

表 8 一 1 常用 于 测试 基因 组 大 小 的 单位 换算 


换算 因子 
单位 微微 克 its WIE x 
微微 克 1 6. 02X10" 0. 98 X 109 
道 尔 顿 1.66 10-12 1 1.62X10-3 


碱 基 对 1.021079 618 1 


真 核 生物 中 细胞 核 基因 组 的 大 小 通常 用 微微 克 (pg)DNA 来 度量 (1pg 王 10 “g)。 较 小 一 些 的 原 
核 生物 的 基因 组 则 通常 用 道 尔 顿 来 度量 , 道 尔 顿 即 一 个 原子 或 分 子 的 相对 质量 单位 .还 有 更 小 的 基因 
组 , 象 细胞 器 和 病毒 等 的 基因 组 ,以 及 某 些 特殊 的 DNA 延伸 物 , 它 们 的 大 小 则 常用 双 链 DNA 或 
RNA 的 碱 基 对 (bp) 或 千 碱 基 对 (kb) 来 表示 (1kb 王 1000bp)。 为 避免 混乱 ,我们 将 只 用 bp 和 kb。 单 位 
换算 因子 可 见 表 8 一 1。 


8.2 细菌 的 基因 组 大 小 的 进化 


细菌 的 基因 组 大 小 其 变化 幅度 超过 了 20 倍 ,从 某 些 限制 性 细胞 间 寄 生物 中 的 约 6X 10°bp 到 几 种 
蓝 细 菌 中 的 10"bp 以 上 ( 表 8 一 2)。 最 小 的 游离 生活 的 原核 生物 , 枝 原 体 , 含 有 包括 50 种 核糖 体 蛋 昌 在 
内 的 350 个 为 蛋白 质 编 码 的 基因 ,两 组 rRNA 基因 (5S,16S 和 23S), 和 大 约 40 个 tRNA 基因 .因此 ,一 
个 枝 原 体 的 基因 组 由 大 约 400 个 基因 所 构成 ,这 接近 于 所 猜测 足够 维持 机 体 自 主 性 生活 的 最 小 数目 
(Muto 等 ,1986) 。 其 他 细菌 中 的 基因 数 大 致 在 500 到 8000 的 范围 内 变化 , 换 句 话说 ,在 特征 细菌 的 种 类 
中 ,基因 数 上 的 变异 与 C 值 方面 的 变异 相同 .因此 ,细菌 看 来 不 会 含有 大 量 的 非 基 因 的 DNA. 

细菌 的 基因 组 可 被 划分 成 3 个 部 分 :(1) 染 色 体 DNA,(2) 源 于 质粒 的 DNA, 和 (3) 可 转 座 因 子 
(Hartl 等 ,1986) 。 染 色 体 部 分 含有 为 生长 和 代谢 功能 所 必需 的 蛋白 质 编码 基因 (70 一 80% ) ,间隔 序列 
和 各 种 信号 序列 (20 一 30%)、 编 码 RNA 的 基因 (一 1%), 以 及 一 些 通 常 长 度 在 几 十 个 碱 基 对 这 一 级 
别 上 的 短 重复 序列 。 细 菌 常 带 有 许多 作为 染色 体外 遗传 成 份 的 质粒 ,然而 ,在 有 些 例 子 中 ,一 些 来 自 质 
粒 的 基因 却 发 现 被 整合 在 细菌 染色 体 中 。 可 转 座 因 子 是 某 些 细 菌 基因 组 的 普通 组 分 。 例 如 , 正 .coli 的 


.123 。 


染色 体 , 至 少 含 有 6 个 不 同类 型 的 插入 序列 各 1 一 10 个 拷贝 (第 七 章 )。 基 因 组 的 非 染 色 体 部 分 (包括 染 
色 体 中 的 插入 序列 和 来 自 质 粒 的 基因 ) 看 来 要 比 染 色 体 部 分 小 一 个 数量 级 。 
表 8 一 2 ”细菌 中 C 值 的 范围 


分 类 单位 基因 组 大 小 的 范围 (kb) 比例 (最 高 /最 低 ) 
真 细菌 650 一 13200 20 
革 兰 氏 阴 性 650 一 7800 12 
革 兰 氏 阳 性 1600 一 11600 7 
蓝 细 菌 3100 一 13200 4 
枝 原 体 650 一 1800 3 
古 细菌 1600 一 4100 3 


资料 自 Cavalier-Smith(1985). 

细菌 中 基因 组 大 小 的 分 布 是 不 连续 的 ,在 模 值 约 0.8X10",1.6X10 和 4.0 久 10*bp 处 呈现 出 主 
峰 , i ZE7. 2X 10°M8. OX 10°bp 处 有 几 个 副 峰 (Herdman ,1985)。 这 种 分 布 引出 了 这 样 的 看 法 : 较 大 的 
基因 组 是 从 较 小 的 基因 组 经 连续 循环 的 基因 组 重复 进化 而 来 的 .由 于 基因 组 大 小 和 细菌 的 系统 发 育 
间 看 来 没有 显著 关系 ,所 以 ,已 经 出 现 了 这 样 一 个 提议 :基因 组 重复 在 细菌 谱系 的 进化 中 是 频频 出 现 
的 (Wallace 和 Morowitz,1973). 

应 用 根据 rRNA 顺序 比较 而 得 出 的 尝试 性 细菌 系统 发 育 , 替 德 曼 (Herdman,1985) 曾 找 出 了 基 
因 组 大 小 变化 与 系统 发 育 史 的 关系 。 其 结果 指示 ,基因 组 重复 在 不 同 细 菌 谱 系 中 是 独立 地 发 生 的 .。 有 
趣 的 是 ,许多 重复 看 来 曾 在 进化 中 的 某 一 相当 特别 的 时 刻 , 即 氧 在 大 气 层 中 出 现 后 不 久 , 大 约 在 18 亿 
年 前 ,同时 出 现在 几 种 不 同 的 细菌 谱系 中 的 。 

概括 起 来 ,细菌 中 基因 组 大 小 的 分 布 能 用 几 个 过 程 的 结合 来 加 以 解释 :(1) 某 些 谱系 中 呼吸 代谢 
独立 进化 期 间 的 基因 组 重复 ,(2) 独 立地 出 现在 许多 谱系 中 的 ,随后 的 基因 组 重复 。(3) 小 规模 的 缺失 
和 插入 ,(4) 复 制 性 转 座 ,(5) 主 要 来 自 质 粒 的 基因 的 水 平 转移 ,和 (6) 许 多 寄生 性 谱系 中 大 量 DNA 丢 
三 


8.3 真 核 生 物 的 基因 组 大 小 和 C-- 值 悖 论 


真 核 生物 中 的 C 值 通常 比 原核 生物 中 的 要 大 得 多 ,但 也 有 例外 。 例 如 ,酵母 Saccharomyces cere- 
visiae 的 基因 组 就 比 许多 革 兰 氏 阳 性 菌 和 大 多 数 蓝 细菌 的 小 .因为 真 核 生物 的 基因 组 有 多 重 的 复制 原 
点 ,而 大 多 数 原核 生物 看 来 只 有 一 个 ,所 以 ,在 复制 出 较 小 原核 生物 基因 组 所 需 的 相同 的 时 间 里 , 真 核 
生物 复制 出 的 DNA 的 量 就 要 大 得 多 。 

真 核 生 物 中 的 C 值 变化 要 比 细菌 中 的 大 得 多 ,从 8.8X10*bp 9. 9X 10" bp, He Fel HE Ut 80000 FF 
( 表 8 一 3)。 单 细胞 的 原生 生物 ,特别 是 肉 足 类 变形 虫 ,在 C 值 上 表现 出 的 变化 最 大 。3 个 羊膜 类 的 纲 


《哺乳 类 、 乌 类 和 疏 行 类 ) 则 相反 ,在 真 核 生物 中 以 它们 在 基因 组 大 小 上 的 变化 小 (最 高 相差 4 倍 ) 而 显 ， 


得 不 同 寻常 。 其 他 的 纲 ,对 那些 C 值 数 据 大 体 上 存在 者 而 言 ,表现 出 至 少 100 倍 的 变异 。 

有 趣 的 是 , 真 核 生 物 间 基因 组 大 小 上 的 巨大 种 间 差 异 看 来 与 生物 的 复杂 性 和 生物 所 编码 的 可 能 
基因 数 没有 什么 关系 。 例 如 , 几 种 单 细 胞 的 原生 动物 具有 上 比 哺乳 动物 要 多 得 多 的 DNA( 表 8 一 4) ,而 后 
者 据 推 测 应 要 更 复杂 一 些 。 而 且 , 一 些 复杂 性 看 来 相似 的 生物 (例如 , 果 蝇 与 蝗虫 ,洋葱 与 百合 ,双核 草 
履 虫 (Paramecium azelia) 与 尾 草 履 虫 (P. caxdatxx) 却 展示 出 极 大 的 C 值 差 异 ( 表 8 一 4) AC 
与 基因 组 中 所 含 的 遗传 信息 的 认定 数量 间 缺 乏 对 应 的 现象 ,以 C a Hit KOC 值 矛盾 (CC value 
paradox) ) 而 著称 于 文献 之 中 。 在 姐妹 种 ( 即 一 些 相互 在 形态 学 上 极为 相似 ,以 至 表 型 上 不 可 区 分 的 种 ) 
的 比较 中 CC 值 矛 盾 也 是 明显 的 。 在 原生 生物 、 真 骨 鱼 类 ,两栖 类 和 显 花 植物 中 ,许多 姐妹 种 ,尽管 根据 
姐妹 种 的 定义 这 些 生 物 间 的 复杂 性 没有 什么 差异 ,但 在 它们 的 C 值 上 却 差别 极 大 。 我 们 可 以 假定 一 
个 物种 不 可 以 具有 少 于 保证 其 生命 功能 所 必需 的 DNA 的 量 , 但 我 们 必须 解释 为 什么 有 那么 多 物种 
含有 远 远 过 剩 的 DNA 的 量 。 
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a 
表 8 一 3 不 同 真 核 生 物 类 群 中 的 C 值 范围 
分 类 单位 基因 组 大 小 范围 (kb) 比例 (最 高 /最 低 ) 
原生 生物 23,500 一 686,000,000 29,191 
眼 虫 类 98,000 一 2,350,000 24 
纤毛 ( 亚 门 ) 类 23,500 一 8,620,000 367 
肉 足 (总 纲 ) 类 35,300 一 686,000,000 19,433 
真菌 8,800—1,470,000 167 
动物 49,000 一 139,000,000 23837 
海绵 49,000—53,900 1 
环节 动物 882,000 一 5,190,000 6 
软体 动物 421,000 一 5,290,000 13 
甲壳 类 686,000 一 22,100,000 32 
昆虫 98,000 一 7,350,000 75 
棘皮 动物 529,000 一 3,230,000 6 
Ke ait 637,000— 2,790,000 4 
B45 1,470,000—15 800,000 11 
真 骨 鱼 类 .382,000 一 139,000,000 364 
两 栖 类 931,000 一 84,300,000 91 
MAT 1,230,00—5,340,000 4 
BX 1,670,000—2,250,000 1 
哺乳 类 1,420,000 一 5,680,000 4 
植物 50,000 一 307,000,000 6,140 
2s 80,000—30,000,000 375 
蕨 类 植物 98,000 一 307,000,000 3,133 
裸子 植物 4,120,000 一 76,900,000 17 
被 子 植物 50,000 一 125,000,000 2,500 


资料 自 Cavalier-Smith(1985) 及 其 他 来 源 。 

要 搞 清 楚 的 第 一 个 问题 是 ,基因 组 大 小 和 基因 的 数目 间 是 否 存 在 相关 .换言之 ,基因 组 大 小 上 的 
差异 应 归 因 于 基因 的 DNA 还 是 非 基因 的 DNAY? 真 核 生 物 在 为 蛋白 质 编码 的 基因 数 上 表现 出 约 有 50 
倍 的 变异 ,从 酵母 中 的 约 3000 个 到 哺乳 动物 中 的 150000 个 左右 (Cavalier-Smith,1985) 。 这 种 50 倍 的 差 
异 显然 不 足以 解释 细胞 核 DNA 在 含量 上 的 80000 倍 的 变异 。 再 者 ,基因 数 是 与 结构 复杂 性 正 相 关 的 ， 
而 基因 组 大 小 则 不 是 .mRNA 分 子 长 度 上 的 种 间 差 异 也 不 能 解释 C 一 值 矛 盾 。 在 不 同 生物 间 编 码 区 
和 非 编码 区 的 平均 长 度 都 有 着 差异 的 情况 下 ,基因 长 度 和 基因 组 的 大 小 间 就 不 会 存在 相关 。 

几 种 编码 RNA 的 基因 的 重复 程度 与 基因 组 大 小 间 的 正 相 关 业 已 被 发 现 ( 第 六 章 )。 类 似 地 , 象 端 
粒 、 着 丝 粒 和 复制 器 基因 ,这样 一 些 在 有 丝 分 裂 和 减 数 分 裂 期 间 为 染色 体 复 制 、 分 离 和 重组 所 必需 的 
调控 序列 ,它们 的 拷贝 数 与 基因 组 大 小 间 也 存在 相关 性 .不 过 ,所 有 这 些 基因 只 构成 基因 组 的 一 小 部 
分 ,以 至 RNA 基因 和 调控 序列 等 的 在 数量 上 的 差异 并 不 能 解释 基因 组 大 小 上 的 差异 。 

总 之 ,我 们 只 剩 下 非 基因 DNA 部 分 作为 造成 C 一 值 矛 盾 的 唯一 嫌疑 犯 。 换 句 话说 , 真 核 基因 组 的 
主要 部 分 是 由 不 含 遗传 信 息 的 DNA 所 构成 的 . 曾 有 估计 认为 ,每 基因 组 非 基因 IDNA 的 量 在 真 核 生 
物 中 从 约 3.0X10sbp 到 1.0X10abp 以 上 (10 万 倍 范围 ) 之 间 变 化 , 且 构 成 了 基因 组 的 量 的 不 到 302 至 
几乎 100% (Cavalier-Smith ,1985) 。 


R84 按 基因 组 大 小 等 级 的 真 核 生物 的 C 值 


物种 C 值 (kb) 
Navicola pelliculosa tt ¥ ) 35,000 
Drosophila melanogaster (FR: #8) 180,000 
Parameciunm aurelia( # € 4) 190,000 
Gallus domesticus (34) 1,200,000 
Erysiphe cichoracearum( Ei fai) 1,500,000 
Cyprinus car pio( M##) 1,700,000 
Lam preta planeri(+t #8 #8 ) 1,900,000 
Boa constrictor (WE) 2,100,000 
Parascaris equorum (4. #3] ) 2,500,000 
Carcarias obscurus( # ) 2,700,000 
Rattus norvegicus(K fa) 2,900,000 
Xenopus laevis (#f) 3,100,000 
Homo sapiens K ) 3,400,000 
Nicotiana tabaccum (48 ©) 3,800,000 
Paramecium caudatum(#f € 4) 84600,000 
Schistocerca gregaria (4 2 ) 9,300,000 
Allium cepa i) : 18,000,000 
Coscinodiscls asterom phalus #E 9) 25,000,000 
Lilium Poe (AF) 36,000,000 
Am phiuma means (4 #6) 84,000,000 
Pinus resinosa(# ) 68,000,000 
Proto pterus aethiopicus (fiii £4. ) 140,000,000 
Ophioglossum petiolatum Bk) 160,000,000 
Amoeba proteus AE FG #2) 290,000,000 
Amoeba dubia (AE 6 8) 670,000,000 


资料 自 Cavalier-Smith(1985) ,Sparrow 等 (1972) 和 其 他 参考 文献 。 


8.4 真 核 生物 基 因 组 的 重复 结构 


真 核 生 物 的 基因 组 有 两 大 特征 :(1) 序 列 的 重复 ,和 (2) 组 成 分 隔 化 ,分 隔 成 以 特别 的 核 苷 酸 组 成 
而 相互 区 别 的 特征 片段 .重复 DNA(repetitive DNA) 是 由 不 同 长 度 和 组 成 的 核 苷 酸 序列 所 构成 ,这 些 
序列 以 串 接 或 散在 的 形式 在 基因 组 中 几 次 出 现 。 不 发 生 重 复 的 DNA 片段 被 称 为 单 拷贝 DNA(single- 
copy DNA) 或 单一 DNA(Cunique DNA) .基因组 中 由 重复 序列 占据 的 部 分 在 各 分 类 单位 间 变 化 极 大 。 
在 酵母 中 ,该 部 分 的 量 约 为 20% ;而 在 哺乳 类 中 , 则 高 达 60%% 的 DNA 是 重复 性 的 .在 植物 中 ,该 部 分 
可 超过 80% ,而 且 比 它 更 高 的 值 也 曾 被 记录 到 (Flavell,1986 ) 。 


布 里 滕 和 科恩 (Britten 和 Kohne ,1968) 所 做 的 关于 DNA 双 链 重新 结合 的 经 典 研 究 表明 , 较 高 ， 


等 的 真 核 生物 ,其 基因 组 大 致 分 分 成 4 部 分 : 折 回 DNA (foldback DNA), BBS DNA (highly repeti- 
tive DNA) ,中 度 重 复 DNA(Cmiddle-repetitive DNA) 和 单 拷贝 DNA( 图 8 一 1) 。 折 回 DNA 由 回 文 DNA 
顺序 所 构成 ,一 旦 这 种 变性 了 的 DNA 被 允许 复 性 时 ,该 顺序 可 以 形成 发 夹 式 的 双 链 结构 。 高 度 重复 


部 分 是 由 长 度 从 几 个 到 成 百 个 核 苷 酸 的 短 序列 所 构成 ,其 重复 数 平均 为 50 万 次 .中 度 重复 部 分 由 平均 


达成 百 或 成 千 碱 基 对 的 长 序列 所 构成 ,它们 在 基因 组 中 以 成 百 的 次 数 出 现 。 
根据 重复 在 基因 组 中 散在 的 模式 ,重复 部 分 已 被 发 现 是 由 两 类 重复 家 族 所 构成 的 :区 域 性 重复 家 
* 126° 
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图 8 一 1 哺乳 类 的 DNA 重新 结合 图 .DNA RAK KY PMACMREA REMBURHAAMEZERADM 
轴 上 的 重新 结合 的 双 链 DNA 百分比 ,显示 出 是 DNA 的 浓度 与 横 轴 上 的 时 间 (Cot) 之 积 的 函数 。 自 Schmid 和 
Deiniger (1975) 修 改 而 成 。 


区 域 化 的 重复 序列 


大 多 数 真 核 生 物 的 基因 组 含有 串联 排列 的 高度 重 复 的 DNA 序列 .在 有 些 物种 中 ,这 些 区 域 化 
的 重复 DNA 序列 可 构成 基因 组 中 DNA 的 主要 部 分 。 例 如 ,在 袋鼠 Dipodomys ordii 中 ,基因 组 的 50 听 
以 上 由 3 个 重复 序列 构成 :AAG(24 亿 次 )TTAGGG(22 亿 次 ) 和 -ACACAGCGGG(12 亿 次 ) 见 (Wide- 
gren 等 ,1985)。 当 然 , 这 些 家 族 并 不 是 完全 同 质 的 ,而 是 含有 许多 变异 型 ,它们 与 一 致 的 顺序 有 一 个 
或 两 个 核 苷 酸 差异 .例如 ,TITAGGG 家 庭 中 ,有 些 序 列 实际 上 是 TTAGAG.。 虽 然 如 此 ,但 许多 区 域 化 
的 高 度 重 复 序列 仍 有 着 相当 一 致 的 核 苷 酸 组 成 ,以 至 根据 基因 组 DNA 的 部 分 化 和 密度 梯度 分 离 , 它 
们 能 形成 一 条 或 多 条 粗 带 .这些 带 明 显 地 与 DNA 的 主 带 和 由 其 他 组 成 更 异 质 的 片段 产生 的 带 有 区 
别 ; 被 称 为 卫星 DNA(Csatellite DNA). 

在 有 些 物 种 中 ,所 有 染色 体 上 都 发 现 有 串 接 排列 的 高 度 重复 序列 ,而 在 另 一 些 物 种 中 它们 则 被 限 
制 在 某 一 特别 的 染色 体位 置 中 。 例 如 , 果 蝇 OD. nasutoides 基因 组 的 60%% 由 卫星 DNA 构成 ,而 这 类 
DNA 全 部 都 处 在 4 对 染色 体 中 的 一 对 上 (图 8 一 2) ,而 这 种 染色 体 上 看 来 几乎 不 含 别 的 DNA(CMiklos， 
1985). 

根据 当前 可 得 到 的 证 据 , 区 域 化 的 高 度 重复 序列 很 有 可 能 是 无 功能 的 .而 且 , 区 域 化 的 高 度 重复 
序列 可 能 既 不 会 降低 .也 不 会 提高 个 体 的 适合 度 。 因 此 ,这 类 序列 的 进化 不 受 自 然 选 择 的 影响 ,而 主要 
是 由 基因 转变 和 不 等 价 交换 (第 六 章 ) 所 决定 的 .这些 机 制 将 产生 两 种 结果 :(1) 序 列 同 质 性 ,和 (2) 拷 
贝 数 随 进化 时 间 而 大 幅度 波动 ( 见 Charlesworth 等 ,1986) .还 曾经 有 这 样 的 提 法 :区 域 化 的 重复 序列 
的 翻转 速率 是 相当 高 的 , 即 ,现存 的 排列 可 能 会 通过 不 等 价 交换 而 被 排除 ,而 新 的 排列 则 可 能 会 通过 
DNA 重复 过 程 而 不 断 地 产生 (Walsh,1987) 。 

大 多 数 串 接 重 复 序列 只 不 过 是 “废物 ?DNA 的 说 法 ,本 质 上 是 说 ,它们 没有 表 型 效应 或 者 它们 对 
它们 的 携带 者 的 适合 度 没有 影响 .这 在 大 多 数 情 况 下 可 能 是 真实 的 ,但 也 有 证 据 表明 高 度 重 复 序列 的 
某 种 特殊 排列 并 不 总 是 如 此 。 果 蝇 . melanogaster 的 自然 群体 中 ,应 答 者 Res ponder (Rs p) 3k A HE 117. A 
20 一 2500 个 拷贝 的 富 含 AT 长 120bp 的 序列 所 构成 (Wu 等 ,1988)。 有 一 次 竟 争 性 实验 涉及 某 一 混合 
| 
| 


群体 ,该 群体 由 含 700 个 重复 拷贝 的 果 蝇 和 只 含 20 个 拷贝 的 果 蝇 构成 ,实验 中 观察 到 只 含 20 个 重复 的 
果 蝇 频率 随时 间 推 移 而 降低 (Wu 等 ,1989)。 因 此 ,已 有 结论 是 , 含 700 个 拷贝 的 果 蝇 有 上 比 只 含 20 个 拷 
贝 的 果 蝇 更 高 的 适合 度 。 目 前 ,Rszp 的 功能 尚 不 知 ,但 它 显 然 不 是 "废物 "DNA, 因 为 它 的 缺乏 会 降低 
适合 度 。 这 些 结果 能 和 否 用 于 其 他 串联 重复 的 序列 ,特别 是 用 于 主要 卫星 DNA 家 族 , 也 是 未 知 的 : 


VY 
if 


图 8 一 2， 果 晶 D. nasutoides 中 高 度 重 复 DNA 序列 (黑色 区 ) 位 于 一 条 染色 体 上 。 自 Miklos(1985) 6K mm. 
散在 的 重复 序列 


第 二 类 高 度 重复 的 DNA 由 散在 于 整个 基因 组 中 的 序列 所 构成 。 散 在 的 高 度 重复 序列 的 拷贝 已 
在 内 含 子 、 基 因 的 侧 又 区 域 . 基 因 间 区 域 .和 非 基因 DNA 中 发 现 .。 有 两 大 类 散在 的 高 度 重复 序列 ; 短 
的 散在 重复 序列 ,缩写 成 SINE, 和 长 的 散在 重复 序列 ,或 LINE(Singer,1982)。 

SINE 中 的 典型 代表 为 短 于 500bp, 且 在 单 倍 体 基 因 组 中 出 现 拷 贝 数 在 10: 或 105 以 上 者 。 与 确定 
tRNA 的 基因 一 样 (第 一 章 ) ,许多 SINE 含有 内 部 转录 信号 且 被 RNA 多 聚 酶 下 转录。 大 多 数 SINE 是 
反 录 序列 。 人 的 基因 组 中 最 著名 的 SINE 家 族 是 Alu 家 族 ( 第 七 章 ) 。 

LINE 原来 曾 被 描绘 成 长 于 5kb、 且 每 基因 组 以 10! 或 其 以 上 的 拷贝 数 存在 的 DNA 序列 (Singer， 
1982)。 人 的 基因 组 中 显然 只 含有 一 个 LINE RK, Bl L1 (Hutchison 等 ,1989)。 这 种 一 致 性 的 L1 PS 
长 约 6kb, 在 一 端 有 一 个 poly A 尾巴 , 且 一 般 由 长 度 短 于 20bp 的 短 顺 向 重复 构成 侧 权 .拷贝 数 大 约 
为 每 单 倍 体 基 因 组 10 万 个 。 丸 多 数 L1 序 列 在 它们 的 5 端 处 被 截断 。 完 整 的 LI 序列 含有 2 个 长 开放 阅读 
框架 ,ORF 一 1 和 ORF 一 2, 分 别 有 约 375 和 1300 个 密码 子 .ORF 一 2 含有 的 氨基 酸 序列 具有 反 转 录 酶 的 


主要 特征 .以 上 特点 表明 ,LI 因子 是 通过 多 聚 腺 苷 化 的 mRNA 的 反 转 录 , 和 该 反 转 录 本 随后 插 人 基 
因 组 中 而 产生 的 。 由 于 LI1 序 列 不 具 长 末端 重复 (LTR), 所 以 它们 很 可 能 是 反 转 录 子 (第 七 章 )。 大 多 数 


L1 序 列 不 被 转录 .不 过 其 中 少数 则 用 RNA 多 聚 酶 工 进行 转录 。 


与 人 的 LI 家族 同 源 的 LINE 已 在 所 有 哺乳 类 ,包括 有 袋 哺乳 类 中 发 现 ( 见 Hutchison 等 ,1989) 。 


与 直 1 相 关 的 非 哺 乳 类 因子 包括 , 果 蝇 中 的 IE.G 和 D Af .Trypanosoma brucei 中 的 Ingi, A # Bom- 


byx mori PH) R 2, 和 玉米 中 的 Cin 4。 物 种 间 的 LI 序列 分 岐 程度 远大 于 同 物种 的 志 1 拷 贝 间 的 分 岐 程 ， 


度 . 例 如 ,来 自 小 鼠 和 人 类 的 D1 序 列 相互 平均 约 有 30%% 的 差异 . 相 比 之 下 ,小 鼠 中 L1 因 子 间 的 顺序 分 
岐 量 只 有 4 上 %(Hutchison 等 ,1989) 。 

由 于 大 多 数 L1 序 列 被 截 去 尾部 ,所 以 它们 不 含有 完整 的 阅读 框架 .结果 ,它们 也 许 不 能 转 座 。 这 
类 有 缺陷 的 因子 被 发 现 比 完整 的 因子 进化 得 更 为 迅速 .而 且 , 有 缺陷 1 序列 的 进化 谱系 已 被 发 现 不 
含 分 枝 ,这 指示 这 些 因 子 不 能 复制 性 转 座 。 于 是 ,它们 可 被 看 成 是 反 转 录 子 的 假 基因 ,对 它们 而 言 功 能 
限制 已 不 再 有 作用 。 大 多 数 L1 序 列 是 有 缺陷 的 ,这 一 事实 的 含义 是 ,基因 组 中 的 L1 因 子 的 传播 仅 依 


赖 于 少数 的 源 因子 。 结 果 , 基 因 组 中 的 LI 因子 是 高 度 同 质 的 , 且 序列 翻转 的 速率 非常 高 .事实 上 , 曾 有 


估计 , 员 齿 类 中 一 半 以 上 的 L1 因 子 只 有 300 万 年 或 者 更 短 一 些 的 历史 (Hardies 等 ,1986 ) 。 

哈 奇 森 等 (Hutchison 等 ,1989) 曾 建议 ,SINE 和 LINE 应 该 重新 加 以 定义 。 即 ,不 用 长 度 和 拷贝 数 
作 诊 断 特 征 ,而 把 LINE 看 成 是 ,应 包括 所 有 具有 为 中 介 它 们 自己 和 它们 后 代 的 转 座 的 蛋白 质 编码 活 
性 的 反 转 录 子 和 反 录 转 座 子 。 另 一 方面 ,SINE 则 应 包括 有 为 这 类 功能 编码 的 反 录 序列 。 


可 转录 基因 的 基因 组 位 置 


RNA 一 DNA 杂交 实验 表明 ,只 有 很 小 一 部 分 的 可 转录 基因 位 于 基因 组 的 重复 部 分 中 。 大 多 数 可 
转录 基因 处 在 单一 DNA 部 分 内 。 即 使 在 单一 部 分 中 ,大 多 数 序列 也 是 不 转录 的 .事实 上 ,人 类 中 只 有 
。]28 。 
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3% BYAE HZ DNA 序列 被 转录 ( 见 Lewin 1990) 。 这 些 实验 进一步 地 支持 真 核 生 物 基 因 组 中 大 多 数 是 
不 具 遗 传 信息 的 观点 。 


8.5 增加 基因 组 大 小 的 机 制 


为 了 解释 真 核 生物 的 基因 组 中 非 基因 DNA 大 量 存 在 的 现象 ,我 们 首先 必须 探讨 可 能 会 导致 基 ， 
因 组 大 小 增加 的 过 程 . 设 想 出 来 的 机 制 应 该 不 仅 能 解释 非 基因 DNA 本 身 的 现象 ,而 且 能 解释 它 的 重 
复 性 和 特别 的 基因 组 分 布 。 

我 们 把 基因 组 增加 分 成 两 种 类 型 :(1) 全 局 性 增加 , 即 整个 基因 组 或 它 的 主要 部 分 ,如 染色 体 , 重 
复 , 和 (2) 局 部 性 增加 , 即 某 一 具体 序列 增殖 而 产生 重复 DNA.。 在 后 一 种 情况 中 ,我 们 又 分 散在 的 重复 ， 
序列 产生 的 机 制 和 区 域 化 重复 序列 产生 的 机 制 。 


“*“” 基 因 组 重复 


由 于 真 核 生 物 的 基因 组 显著 地 大 于 真 细 菌 的 基因 组 ,所 以 , 真 核 生物 从 原核 生物 的 祖先 进化 而 来 
的 过 程 必须 涉及 基因 组 大 小 上 的 增加 .有 几 种 分 子 机 制 可 以 导致 基因 组 大 小 上 的 增加 。 造 成 基因 组 增 
长 的 一 个 重要 因素 是 基因 组 重复 (genome duplication ) 或 基因 组 加 倍 (genome doubling) .基因组 重复 
是 在 DNA 复制 之 后 ,由 于 缺少 所 有 染色 单 体 间 的 分 裂 过 程 而 产生 的 结果 。 

假定 哺乳 类 基因 组 比 细菌 的 基因 组 大 1000 倍 左右 ,并 假定 基因 组 重复 是 造成 基因 组 增 大 的 唯一 
原因 , 则 我 们 可 以 推出 ,基因 组 从 原始 的 细菌 大 小 增加 到 现在 哺乳 类 中 的 大 小 ,大 约 需要 10 轮 基因 组 
重复 .从 另 一 个 角度 看 , 即 基因 组 重复 平均 每 3 亿 年 出 现 一 次 。 另 一 方面 ,如 果 DNA 含量 是 以 小 段 
DNA 连续 增加 的 方式 增长 ,比如 说 通过 转 座 或 不 等 价 交换 , 则 从 细菌 到 哺乳 类 基因 组 增长 的 速率 近 
似 为 每 年 7 个 核 苷 酸 (Nei,1969) 。 

基因 组 大 小 的 多 峰 态 值 的 分 布 也 已 在 许多 真 核 生 物 类 群 中 被 记录 到 (Rees 和 Jones,1972;Grime 
和 Mowforth , 1982) ,这 与 细菌 中 的 情形 类 似 ( 见 第 119-120 页 )。 这 在 单子 叶 植物 中 特别 明显 ,它们 的 
基因 组 大 小 在 0. 60,1. 18,2. 16,4. 5118. 53 X 10°bp 处 出 现 峰值 ,表现 出 一 种 多 峰 态 值 的 分 布 (Spar- 
row 和 Nauman,1976)。 类 似 的 分 布 也 曾 在 别 的 类 群 , 如 环 皮 动物 `. 昆 由 和 真菌 中 观察 到 ,以 及 在 两 栖 
类 和 真 骨 鱼 类 中 , 较 小 范围 地 观察 到 .基因 组 重复 或 多 倍 性 重复 (polyploidy) 看 来 是 真 核 生 物 基因 组 
大 小 进化 的 主要 机 制 。 有 趣 的 是 ,每 一 轮 基 因 组 重复 都 牵涉 DNA 的 少量 丢失 ,所 以 ,每 轮 重 复 后 
DNA 的 量 都 是 以 一 个 略 小 著 2 的 因子 增加 (Sparrow 和 Nauman ,1976) 。 在 新 近 形 成 的 多 倍 体 中 ,还 谈 
不 上 C 值 方面 的 增加 ,因为 该 值 是 指 单 倍 体 的 大 小 ,而 这 两 个 基因 组 经 历 过 突变 、 易 位 、. 染色体 重 排 
和 染色 体 数 目 上 的 变化 后 ,它们 将 最 终 会 变 成 一 个 新 的 基因 组 ,到 那 时 才 谈 得 上 OC 值 增 加 的 问题 。 换 
言 之 ,一 个 古老 的 多 倍 体 与 一 个 二 倍 体 将 是 不 可 区 别 的 (Cavalier-Smith ,1985 ) 。 

多 倍 性 重复 是 自然 界 中 的 一 个 普遍 现象 ;然而 ,在 进化 的 历史 中 多 倍 体 看 来 很 少 能 生存 下 来 .在 
许多 情况 下 ,其 原因 是 ,多 倍 性 重复 是 有 害 的 ,因而 会 受到 选择 的 强烈 对 抗 。 多 倍 性 重复 的 有 害 效应 包 
括 :(1) 细 胞 分 裂 时 间 大 大 延长 ,(2) 细 胞 核 的 体积 增 大 ,(3) 在 减 数 分 裂 的 分 离 期 间 染 单 体 断裂 的 数目 
显著 增加 ,(4) 遗 传 不 平衡 ,和 (5) 在 生物 的 性 别 由 性 染色 体 和 常 染色 体 间 的 数目 比 ( 例 如 果 蝇 ) ,或 性 
染色 体 与 倍数 性 间 的 数目 比 ( 例 如 膜 翅 目 ) 来 决定 的 情况 下 ,干扰 性 别 分 化 .在 有 些 情况 下 ,多 倍 性 重 
复 可 能 是 有 利 的 , 象 在 显 花 植物 中 , 它 可 以 减少 或 消除 杂种 不 育 性 ( 见 Cavalier-Smith,1985) 。 


染色 体重 复 


一 个 染色 体 的 重复 ,或 非 整数 倍 重复 ,大 多 数 是 有 害 的 。 在 哺乳 类 中 , 它 常 伴随 着 致死 性 或 不 育 
性 .在 人 类 中 ,众所周知 的 例子 包括 象 唐 氏 (Down) 综 合 症 (21 三 体 ) 和 第 18 染 色 体 三 体 等 频频 出 现 的 
病症 .类 似 的 有 害 症状 也 会 与 染色 体 的 部 分 重复 相关 联 。 因 此 ,染色 体重 复 预期 对 基因 组 大 小 上 的 增 
加 不 会 有 显著 贡献 。 

在 许多 生物 中 ,特别 是 在 那些 被 调查 得 最 彻底 的 植物 群体 中 ,已 经 观察 到 几 个 建立 了 额外 染色 
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体 , 即 所 谓 B- 染 色 体 (B-chromosomes) 的 例子 (Jones,1985) 。.B- 染 色 体 不 是 整个 染色 体 精 确 地 重复 ,而 
可 被 看 成 是 部 分 染色 体重 复 的 产物 .这 些 额 外 染色 体 看 来 不 含 太 多 基因 ,而 且 它 们 大 多 数 是 由 短 重 复 
序列 所 构成 的 ( 即 它们 是 高 度 异 染色 质 的 ) -因此 ,部 分 非 整数 倍 重 复 可 能 在 进化 期 间 的 基因 组 大 小 增 
长 过 程 中 起 作用 ,但 对 于 基因 数 的 进化 或 许 并 无 重大 贡献 。 


基因 组 大 小 的 区 域 性 增加 


基因 组 大 小 的 区 域 性 增加 可 由 转 座 ( 第 七 章 ) 和 不 等 价 交换 (第 一 和 第 六 章 ) 所 引起 .前 一 种 模式 
将 产生 散在 的 重复 序列 ;后 一 种 则 产生 串联 的 重复 序列 。 基 因 组 大 小 的 区 域 性 增加 也 可 通过 获得 外 来 
DNA( 第 七 章 ) 而 实现 ;不 过 ,此 过 程 的 贡献 与 整个 DNA 大 小 比 起 来 或 许可 忽略 不 计 。 

曾 有 建议 认为 , 真 核 生 物 中 所 有 中 度 重 复 的 DNA 部 分 都 起 源 于 可 转 座 因子 .不 过 ,这 些 因 子 中 
大 多 数 已 不 再 可 动 , 它 们 的 转 座 能 力 已 被 突变 或 别 的 因子 的 插入 摧毁 了 。 例 如 , 果 蝇 中 的 异 染 色 质 的 
大 多 数 ,实际 上 也 许 是 这 类 已 经 死亡 了 的 因子 的 莫 地 .不 过 , 非 活性 的 易 动因 子 能 通过 不 等 价 交 换 那 
样 的 过 程 而 局 部 地 增殖 。 

许多 区 域 性 重复 序列 曾经 是 由 不 等 价 交换 而 产生 的 。 然 而 ,看 起 来 不 等 价 交换 更 常 做 的 是 打 散 串 
联 排列 、 而 不 是 增加 它们 的 大 小 和 拷贝 数 ,所 以 ,该 过 程 并 不 能 解释 所 有 区 域 性 重复 DNA 存在 的 原 
因 (Walsh,1987)。 再 者 ,不 等 价 交换 通常 产生 的 是 由 相对 而 言 较 长 的 重复 单位 构成 的 序列 。 相 比 之 
下 ,许多 区 域 性 重复 序列 , 象 卫星 DNA, 则 是 由 非常 短 的 ,简单 地 重复 的 主体 所 构成 的 ( 见 第 123 页 ) 。 
为 了 解释 这 类 序列 存在 的 原因 ,DNA 扩 增 被 担 了 出 来 .DNA 3°48 (DNA amplification) 是 指 ,任何 一 种 
将 某 一 基因 或 DNA 序列 的 拷贝 数 增加 到 远 超出 一 个 生物 的 特征 水 平 之 上 的 事件 .狭义 地 ,DNA 扩 
” 增 指 在 一 个 生物 的 寿命 期 间 中 发 生 , 且 使 某 一 DNA 序列 的 拷贝 数 突然 增加 的 事件 。 


扩 增 的 最 有 效 方法 之 一 是 DNA 复制 的 滚 环 模型 (rolling-circle mode) (图 8 一 3;Bostock ,1986) 。 这 
桨 色 体 rDNA 重复 
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图 8 一 3 HMLP Sw MPRAT HORRY. LEAKY RNARA LPR. SATHEAD (RE) HR 
转录 部 分 (白色 )。 扩 增 涉 及 一 个 染色 体外 环 状 拷贝 的 形成 ， 该 拷贝 含有 数目 可 变 的 重复 ,通过 多 轮 的 滚 环 复制 而 扩 
增 。 注 意 , 重 复 的 周期 性 可 朋 能 随 滚 环 扩 增 而 变化 。 自 Bostock(1986) 修 改 而 成 。 
$f ISI eH oa HWE CEG 肖 NX 基 因 的 扩 增 .在 这 种 情况 下 的 扩 增 包括 外 时 对 
序列 的 染色 体外 环 状 拷贝 的 形成 ,然后 可 产生 许多 新 增加 的 含 原 串 接 重复 序列 的 染色 体外 单位 .如 果 
这 样 一 些 单位 整合 回 染色 体 中 , 则 该 基因 组 将 增加 了 由 等 同 的 重复 序列 构成 的 部 分 。 
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复制 滑脱 (replication slippage ) 5X 7% At $2 i® At (slipped-strand mispairing) 是 这 样 一 种 过 程 , 即 DNA 
多 聚 酶 转 回来 并 用 同一 个 模板 以 产生 一 个 重复 (图 1 一 8) 。 现 存 的 串 接 重复 序列 特别 容易 造成 复制 滑 
脱 , 因 而 此 过 程 能 产生 短 重 复 的 非常 长 串 的 排列 。 滚 环 复 制 和 复制 滑脱 都 能 提供 关于 串 接 重复 序列 在 
基因 组 中 迅速 增生 的 机 制 .然而 ,对 于 这 些 过 程 经 验 性 证 据 仍 然 是 有 限 的 。 


8.6 非 基 因 DNA 的 维持 


解决 C 一 值 了 矛盾 问题 以 及 说 明 真 核 生物 基因 组 的 结构 ,需要 我 们 为 大 量 非 基 因 的 、 看 起 来 完全 是 
多 余 的 DNA 的 长 期 维持 提出 一 个 进化 机 制 . 这 反 过 来 又 与 这 样 的 问题 紧密 联系 在 一 起 :这 种 DNA 
如 果 有 功能 的 话 、 那 么 可 能 会 是 什么 样 的 功能 呢 ? 为 对 这 一 现象 作出 进化 论 的 解释 ,已 有 不 少 尝试 .下 
面 我 们 将 给 出 4 种 这 样 的 假说 。 

1、 非 基因 IDNA 行使 着 至 关 重 要 的 功能 , 象 基因 表达 和 全 局 性 调控 之 类 (Zuckerkandl,1976) 。 根 
据 这 一 假说 ,DNA 的 过 剩 只 是 表面 上 的 ,而 这 种 DNA 是 全 部 都 有 功能 的 .因此 ,这 类 DNA 的 缺失 或 
去 除 将 对 适合 度 具 有 害 影 响 。 

2. 非 基因 DNA 是 无 用 的 废物 DNA(Ohno,1972) , 它 被 染色 体 所 被 动 地 携带 仅仅 只 是 因为 它 与 
有 功能 的 基因 在 实体 上 是 连续 的 。 根 据 这 一 观点 , 则 过 剩 的 DNA 并 不 影响 该 生物 的 适合 度 , 于 是 将 
无 限制 地 从 一 代 传 给 另 一 代 。 

3、 非 基因 DNA 是 一 种 无 功能 的 “寄生 物 ”(Ostergren ,1945) 或 “自私 DNA”(Orgel 和 Crick 1980; 
Doolittle 和 Sapienza,1980) ,是 通过 基因 组 间 选 择 而 累积 且 被 积极 地 维持 的 。 

4.DNA 有 一 种 结构 的 或 核 类 型 的 (nucleotypic) 功 能 , 即 一 种 与 携带 遗传 信息 的 任务 无 关 的 功能 
(Cavalier-Smith ,1978) 。 

关于 第 一 种 假说 的 证 据 极 少 .事实 上 ,大 多 数 资料 倒是 指示 出 ,现在 被 认为 是 非 基因 的 DNA 事 
实 上 就 是 无 功能 的 ,它们 中 大 多 数 可 以 缺失 而 不 造成 可 查 觉 的 表 型 效应 。 真 核 生 物 中 的 过 剩 DNA 看 
来 也 不 会 加 重 代 谢 系 统 的 负担 ,在 维持 和 复制 大 量 非 基因 IDNA 时 能 量 和 营养 方面 的 耗费 看 来 也 不 
是 过 分 的 .所 以 ,有 可 能 大 多 数 非 基 因 DNA 事实 上 就 是 废物 或 自私 DNA. 

然而 ,维持 大 量 的 非 基因 DNA 也 可 能 会 有 一 些 不 利之 处 .首先 ,大 基因 组 对 诱 变 剂 的 敏感 性 表 
现 得 比 小 基因 组 的 高 (Heddle 和 Athanasiou,1975)。 其 次 ,维持 和 复制 大 量 的 非 基 因 DNA 可 能 会 给 
该 生物 带 来 一 定 的 负担 ,特别 是 当 基因 组 的 绝 大 部 分 都 是 非 基 因 的 时 。 

卡 瓦 利 耶 一 史密斯 ( Cavalier 一 Smith,1978,1985) 争 辨 说 ,一 定 有 一 种 维持 大 基因 组 的 “主要 的 
进化 力量 ”. 他 的 假说 是 ,这 种 DNA 起 着 决定 细胞 核 体 积 的 核 骨架 作用 。 因 为 细胞 越 大 要 求 细胞 核 也 
越 大 ,所 以 ,导致 某 种 特别 的 细胞 体积 的 选择 ,将 会 次 生出 导致 某 种 特别 的 基因 组 大 小 的 选择 的 结果 。 
根据 这 一 蓝图 ,过剩 DNA 是 由 选择 来 维持 的 ,而 它 的 核 苷 酸 组 成 则 可 随机 地 改变 。 非 基因 DNA 的 附 
加 的 核 类 型 功能 可 能 是 机 械 的 .例如 ,一 种 高 度 重 复 、 串 接 排列 的 卫星 DNA ,可 能 会 影响 染色 体 建筑 
样式 ,特别 是 它 的 曲 度 和 核 粒 的 相位 。 有 些 卫星 DNA 已 知 还 与 特异 性 的 染色 体 和 蛋白 结 合 , 后 者 则 可 
能 在 减 数 分 裂 和 有 丝 分 裂 期 间 影响 染色 体 的 凝聚 ,因而 也 许 有 基因 调控 方面 的 效应 (Levinger 和 Var- 
shavsky ,1982;James 和 Elgin,1986) 。 

没有 一 种 解释 看 来 是 已 解决 了 C 一 值 矛 盾 问 题 的 .以 上 所 有 机 制 , 以 及 许多 另外 的 机 制 , 都 可 能 
只 对 维持 “过 度 的 ?基因 组 大 小 有 贡献 ,而 我 们 将 来 的 任务 则 是 决定 每 种 机 制 的 相对 贡献 。 


8.7 细菌 中 的 GC 含量 


在 真 细菌 中 ,基因 组 序列 中 鸟 味 吟 和 胞 喀 啶 的 平均 百分比 ,或 GC 含量 (GC content) , Z J 2425 % 
到 75% 范 围 内 变化 。 在 许多 情况 下 ,细菌 的 GC 含量 看 来 与 系统 发 育 有 关 , 亲 缘 关 系 接 近 的 细菌 有 者 
类 似 的 GC 含量 (图 8 一 4)。 
解释 细菌 中 GC 含量 的 变异 本 质 上 有 两 类 假说 。 选 择 论 者 把 GC 含量 看 成 是 对 环境 条 件 的 一 种 
2 iis 轴 


适应 形式 。 例 如 ,生活 在 非常 热 的 生态 位 中 的 哮 热 细菌 ,强烈 地 倾向 于 应 用 由 富 GC 的 密码 子 编码 的 
对 热 稳定 的 氨基 酸 ( 例 如 丙 氨 酸 和 精 氮 酸 ), 且 极力 避免 用 由 少 GC 的 密码 子 编码 的 对 热 不 稳定 的 氮 
基 酸 (例如 丝氨酸 和 赖 氨 酸 ), 这 一 现象 已 有 若干 报导 (例如 ,Argos 等 1979;Kagawa 等 ,1984; 
Kushiro 等 ,1987)。 因 此 ,GC 含量 可 能 是 一 种 由 选择 决定 的 性 状 。 另 一 个 涉及 选择 论 的 事件 要 借助 紫 
外 线 辐 射 作 为 选择 力量 .因为 工 - 工 二 聚 体 对 辐射 敏感 ,所 以 ,土壤 上 层 的 微生物 ,由 于 它们 常 暴 露 在 
阳光 下 ,就 应 该 比 不 暴露 在 阳光 下 的 ,比如 说 象 于 .coi 那样 的 肠 道 细 菌 ,含有 更 高 的 GC 含量 (Singer 


和 Ames,1970). 


Escherichia coli (50) 

Proteus vulgaris (40) : 
Serratia marcescens (59) 革 兰 氏 阴 性 蓝 
Pseudomonas fluorescens (60) 

Micrococcus luteus (74) 9 
Streptomyces griseus (72) 革 兰 氏 阳 
Mycobacterium tuberculosis (67) { 性 放 线 菌 
Anthrobacter luteus (69) 

Bacillus subtilis (43) 

Streptococcus faecalis (35) 革 兰 氏 阳 性 
Lactobacillus viridescens (40) A 亚 组 菌 
Staphylococcus aureus (33) 
Mycoplasma capricolti (25) ae 
Spiroplasma sp. BC3 (26) = A 
Acholeplasina laidlawii (32) 性 枝 原 体 
Clostridium innocuwum (26) 革 兰 氏 阳 性 


Clostridium perfringens (38) | 芽孢 梭 菌 


图 8 一 4 几 种 真 细 菌 中 基因 组 的 GC 含量 (括号 中 的 数字 )。 该 系统 树 是 根据 5S rRNA 序列 构建 的 。 分 枝 是 无 尺度 
的 。 自 Hori 和 Osawa(1986), 和 Muto 等 (1986,1987) 的 资料 结合 而 成 。 
突变 论 者 的 观点 则 以 突变 模式 中 的 倾向 性 来 解释 GC 含量 上 的 变异 (Suevka, 1964; Muto 和 Os- 
awa,1987)。 根 据 这 一 观点 , 某 一 给 定 细菌 种 的 GC 含量 是 由 以 下 两 个 因素 的 平衡 所 决定 的 :(1) 从 G 
或 C 到 工 或 A 的 替换 速率 ,用 u 表 示 , 和 (2) 从 A 和 T 工 到 G 或 C 的 替换 速率 ,用 v 表示 。 处 于 平衡 时 ， 
GC 含量 预期 为 


cae U 
fe | wae (8. 1) 
因此 ， 
u 1 OP See 
Gt es. (8. 2) 


比率 u/v 又 称 GC 突变 压力 (GC mutational pressure), 4 u/v 为 3. OM, -- @AAHW GCC 含量 将 为 
25% tJ Mycoplasma capricolum 中 的 情形 就 是 如 此 。 当 该 比率 为 1 时 ,GC 含量 将 为 50% RE E. 
coli 中 那样 。 当 它 为 0. 33 时 ,GC 含量 将 为 75% ,如 在 Micrococcus luteus 所 示 。 不 过 ,要 估计 GC 突变 压 
力 , 最 好 选用 没有 选择 限制 的 部 位 而 不 要 用 总 GC & &.. BO, Mycoplasma capricolum 的 为 蛋白 质 编 
码 基 因 中 ,四 重 简 并 位 点 上 的 GC 含量 低 于 10% (图 8 一 5)。 因 而 ,u/v — x ey £9. 2 WW HH, Micrococcus 
luteus 中 简 并 位 点 上 的 Poc>>0. 9, Ar LA u/v<0. 11. 

除 GC 突变 压力 外 ,突变 引起 的 变化 也 受 选择 限制 。 换 句 话 说 ,替换 的 模式 是 由 突变 模式 和 对 抗 


某 些 突变 的 纯洁 化 选择 的 模式 所 决定 的 (第 四 章 )。 某 一 特定 区 域 中 的 选择 限制 越 弱 ,GC 突变 压力 对 


GC 组 成 的 影响 就 越 强 .图 8 一 5 展示 了 总 GC 含量 与 3 个 密码 子 位 置 上 GC 含量 间 的 相关 ,数据 来 自 11 
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图 8 一 5 总 基因 组 DNA 和 第 一 、 第 二 以 及 第 三 密码 子 位 置 间 GC 含量 的 相关 。 虚 线 表示 基因 组 中 与 密码 子 中 GC 
含量 间 完 全 对 应 时 的 理论 期 望 关 系 。 自 Muto 和 Osawa (1987). 
种 细菌 ,覆盖 了 范围 相当 广 的 GC 含量 值 . 我 们 看 到 ,第 三 密码 子 位 置 上 的 相关 与 无 选择 情况 下 的 预 
期 相关 类 似 。 另 一 方面 ,第 一 和 第 二 密码 子 位 置 上 的 相关 ,在 正 相 关 的 情况 下 , 则 表现 出 平缓 得 多 的 坡 
度 。 根 据 下 面 所 说 的 事实 这 很 容易 得 到 解释 , 即 作用 在 大 多 数 简 并 的 密码 子 第 三 位 置 上 的 选择 , 远 不 
如 第 一 和 第 二 位 上 的 那样 严峻 (第 四 章 ) ,以致 于 第 三 位 上 的 GC 水 平 很 大 程度 上 是 由 突变 压力 来 决 
定 的 。 


8.8 兰 椎 动物 基因 组 的 组 成 上 的 组 织 化 


图 8 一 6 展示 了 不 同 生 物 类 群 中 的 GC 含量 .有趣 的 是 ,虽然 多 细胞 的 真 核 生 物 的 基因 组 大 小 一 般 
要 比 原核 生物 的 大 ,但 真 核 生物 中 的 GC 含量 却 表现 出 了 小 得 多 的 变异 .特别 地 , 关 椎 动物 的 基因 组 
显示 出 有 相当 一 致 的 GC 含量 ,处 在 从 约 40%% 到 45% 的 范围 中 (Sueoka,1964)。 兰 椎 动物 中 的 GC 含量 
处 于 一 个 较 小 的 范围 内 的 部 分 原因 也 许 是 , 肴 椎 动物 与 细菌 不 同 ,它们 相互 分 岐 的 时 间 还 不 够 长 ,所 
以 还 不 能 在 GC 含量 上 积累 较 大 的 差异 。 

虽然 脊椎 动物 在 基因 组 的 GC 含量 上 有 一 致 性 ,但 它 的 基因 组 却 有 着 比 原核 生物 基因 组 更 复杂 
的 组 成 上 的 组 织 化 。 当 养 椎 动物 的 基因 组 被 随机 地 裁剪 成 长 30 一 100kb 的 片段 ,并且 将 这 些 片 段 按 其 
碱 基 组 成 分 离 时 ,这 些 片段 即 聚 类 成 为 数 不 多 的 、 可 通过 其 GCC 含量 而 相互 区 别 的 ( 富 GC 片段 比 富 
AT 片段 重 ) 类 型 .每 一 类 都 以 有 虽 不 等 同 但 却 相 似 的 碱 基 组 成 带 为 特征 (Bernardi 等 ,1985 ; Bernardi, 
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图 8 一 6 不 同 生物 美 群 中 的 GC 组 成 。 自 Sueoka(1964)。 
1989) 。 

温 血 和 冷血 状 椎 动物 的 基因 组 间 在 组 成 上 的 组 织 化 方面 有 明显 差异 (Bernardi 等 ,1985,1988) 。 
图 8 一 7a 展示 了 ,来 自 鲤 Cyzprzzzs carpio 和 两 栖 类 Xenopus laevis AA) WURK B 3A ih HED D : 
MW RAA GRD NH EB DNA 组 分 的 相对 量 和 浮力 密度 .在 鸡 . 小 鼠 和 人 的 基因 组 中 ,有 两 个 轻 组 
SLA LD) ,代表 了 约 三 分 之 二 的 基因 组 ,以 及 两 个 或 三 个 重组 分 (Hi ,H:, 和 了:75 代 表 余 下 的 三 分 
之 一 。 相 比 之 下 ,来 自 大 多 数 冷 血 兰 椎 动物 的 基因 组 DNA 则 主要 为 轻 组 分 (图 8 一 7a) .例如 ,在 Xeno- 
pus 中 ,密度 高 于 1.704g/cm 的 DNA 片段 占 基 因 组 的 比例 少 于 10%%, 相 比 之 下 温 血 兰 椎 动物 则 占 30 
—40%, 

DNA 片段 的 组 成 上 的 分 布 很 大 程度 上 是 与 这 类 片段 的 大 小 独立 的 ,这 指示 出 在 非常 长 的 DNA 
链 中 有 某 种 组 成 上 的 同 质 性 .这 种 同 质 的 长 段 术语 称 为 同 质 段 (isochore)。 图 8 一 7b 展示 了 来 自 温 血 
SHAD Hh) AK DNA 的 镰 典 式 组 织 化 ( 即 , 轻 与 重 同 质 段 轮流 出 现 )。 当 这 些 同 质 段 在 DNA 裁剪 
期 间断 裂 时 ,4 种 较 大 的 有 不 同 GC 含量 的 分 子 家 族 即 产生 了 。 贝 尔 纳 迪 等 (Bernardi 等 ,1985) 的 结论 
是 , 富 GC 的 ( 重 的 ) 同 质 段 约 占 温 血 状 椎 动物 基因 组 的 三 分 之 一 ,而 在 冷血 养 椎 动物 中 则 几乎 没有 。 

温 血 肴 椎 动物 的 基因 组 是 灸 挫 式 的 ,这 一 发 现 与 染色 体 分 带 研究 的 结果 是 一 致 的 。 温 血 肴 椎 动物 
的 中 期 染色 体 , 当 用 莉 光 染料 ` 蛋白酶 水 解 , 或 有 差别 的 变性 条 件 处 理 时 ,将 显现 出 清晰 的 吉姆 萨 
(CGiemsa) 暗 带 (G 一 带 ) 和 亮 带 (R 一 带 ) 。 与 之 成 对 照 的 是 ,冷血 糊 椎 动物 的 中 期 染色 体 则 只 显 出 很 少 
的 分 带 ,或 完全 不 分 带 。 因 此 , 曾 有 建议 认为 , 少 GC 和 富 GC 同 质 段 大致 上 分 别 对 应 于 G 一 带 和 民 三 
带 (Comings,1978;Cuny 等 ,1981) 。 关 于 基因 的 复制 时 序 的 研究 表明 ,位 于 富 GC 同 质 段 (R 一 带 ) 中 的 
基因 在 细胞 周期 的 早期 复制 ， 而 位 于 少 GC 同 质 段 (G 一 oo se 等 ， 
1984; Bernardi 等 ,1985;Bernardi,1989 ) 。 


同 质 段 中 基因 的 位 置 


很 多 来 自 人 和 其 他 温 血 肴 椎 动物 的 基因 组 中 的 基因 , 曾 用 与 适当 的 探 针 杂交 的 方法 而 被 定位 在 
这 类 组 成 上 的 同 质 段 上 (Bernardi 等 ,1985)。 这 些 研究 指出 ,基因 在 整个 基因 组 中 的 分 布 是 明显 地 非 
随机 的 ,大 多 数 基因 位 于 仅 占 基因 组 的 3 一 5 狼 的 最 重组 分 (H3) 中 。 

在 大 多 数 情况 下 ,基因 是 处 在 有 与 其 自身 类 似 的 GC 含量 的 DNA 片段 中 。 这 一 发 现 为 同 质 段 的 
存在 提供 了 独立 的 证 据 ， 风骨 天生 人 国生 术 人 的 全 于 和 这 省 。 事实 上 ,因为 构成 DNA 
制备 物 的 这 些 片段 是 经 随机 降解 而 产生 的 ,所 以 ,这 些 带 有 基因 的 片段 在 组 成 上 处 于 较 狭 窗 的 范围 中 
的 现象 表明 ,它们 在 约 两 倍 于 这 些 片段 自身 大 小 的 区 域内 ( 即 高 到 200kb), 有 着 非常 同 质 的 碱 基 组 
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图 8 一 7 (AA RRA,.RKA Cyprinus car pio( 4) fe Xenopus Laevis( 爪 歇 )( 左 图 ) 和 来 自 鸡 、 小 筷 与 人 ( 右 图 ) 的 主 
要 DNA FRR HH ES HF HER. DAR MHA LK DNA 的 镶 风 组 织 化 的 模式 图 。 当 这 些 同 质 段 在 
DNA 制备 期 间 随机 断裂 时 ,4 种 较 大 的 具 不 同 GC 含量 的 分 子 家 族 即 产生 了 .还 有 几 种 较 小 的 杂种 家 族 产生 。 自 
Bernardi 等 (1985) 。 
成 。 8 
DNA 序列 数据 分 析 已 揭示 出 ,在 基因 、 外 显 子 和 内 含 子 的 GC 水 平 , 与 它们 处 于 其 中 的 大 段 
DNA 区 域 的 GC 水 平 间 存 在 正 相 关 (Bernardi 和 Bernardi,1985;Bernardi 等 ,1985;Ikemura,1985;Ao- 
ta 和 Ikemura,1986) .图 8 一 8 将 人 类 中 的 % 一 和 有 一 珠 蛋 日 驴 进 行 了 对 比 .B 和 类 有 昌 珠 蛋白 基因 是 低 GC 
含量 的 , 且 它 们 处 在 低 GC KM RZ. 和 类 w 珠 蛋 白 基 因 是 富 含 GC 的 , 则 它们 处 在 富 含 GC 的 区 
域 中 。 同 样 的 情形 也 曾 在 免 、. 山 羊 和 小 鼠 中 发 现 。 在 鸡 中 ,B 一 和 一 珠 蛋 白 基 因 都 是 富 含 GC 的 ,而 且 
两 者 都 处 在 富 GC 的 区 域 中 。 相 比 之 下 ,Xenopaus( 爪 蟾 ) 中 的 一 和 8 一 珠 蛋 白 基 因 则 是 少 GC 的 ,并 
且 两 者 都 处 在 少 GC 的 区 域 中 。 

在 绝 大 多 数 情 况 下 ,编码 区 中 的 GC 含量 有 高 于 侧 区 中 含量 的 倾向 (图 8 一 9)。 我 们 还 看 到 ,第 三 
密码 子 位 置 上 的 GC 水 平 , 平 均 下 来 高 于 内 含 子 中 的 水 平 , 而 后 者 则 又 比 5 和 3' 侧 区 域 中 的 水 平 高 。5/ 
侧 区 中 的 GC 水 平 又 高 于 3' 侧 区 中 的 ,这 或 许 是 因为 启动 子 及 其 周围 区 域 倾向 于 富 含 GC 的 缘故 。 
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图 8 一 8 GC 含量 活 人 的 珠 蛋 白 DNA 顺序 的 分 布 :(a)B 一 珠 蛋 白 基 因 徐 ;(b)a 一 珠 蛋 白 基 因 族 (不 完全 )。 这 些 基因 
( 粗 线 ) 以 与 图 6 一 7 中 同样 的 次 序 排 列 。 这 些 基 因 的 名 称 显 示 在 该 图 的 底部 ;区 域 1 是 5 和 居 之 间 的 基因 间 区 。 在 尼 
一 珠 蛋 白 签 和 履 盖 qdl 一 和 a2 一 珠 有 蛋白 基因 的 区 域 中 ,每 一 点 代表 围绕 该 点 的 2001 个 核 音 酸 的 GC 组 成 的 平均 值 ， 
而 其 他 区 域 中 的 每 一 点 则 代表 1401 个 核 苦 酸 的 平均 值 。. 水 平 的 虚线 表示 整个 人 的 基因 组 的 GC 含量 (40% ) 。 自 站 e- 
mura 和 Aota(1988) 修 改 而 成 。 
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图 8 一 9 基因 的 各 个 区 域 中 的 GC 百分比 含量 间 的 关系 。(a) 第 三 密码 子 位 置 与 5 侧 区 。(b) 第 三 密码 子 位 置 与 内 会 
子 。(c) 第 三 密码 子 位 置 与 3' 侧 区 。(d) 内 仿 子 与 5 侧 区 。(e) 内 例子 与 3` 侧 区 。(f)5' 侧 区 与 3 侧 区 。 自 Aota 和 Ikemura 
(1986). 
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同 质 段 的 起 源 一 如 其 被 争论 的 那样 神秘 莫 测 .注意 , 问 题 在 于 DNA 的 长 区 段 (30kb 或 更 长 一 
些 ), 它 的 普遍 趋势 是 或 者 是 富 GC 的 或 者 是 少 GC 的 ,而 不 是 在 GC 含量 上 发 生 局 部 变异 一 象 我 们 在 
基因 的 各 不 同 区 域 中 所 看 到 的 那样 。 贝 尔 纳 迪 等 (Bernardi 等 ,1985;1988) 提 出 , 同 质 段 是 因 功 能 上 
的 ( 即 选择 上 的 ?优势 而 产生 的 。 他 们 的 主要 论据 是 ,在 温 血 生物 中 ,GC 含量 上 的 增加 可 以 保护 DNA、 
RNA 和 和 蛋白 质 免 受热 的 降解 ( 见 下 面 ) ,因为 G 一 C 键 是 比 A 一 T 键 强 的 化 学 键 (第 一 章 )。 我 们 称 这 
个 观点 为 选择 论 者 的 假说 (selectionist hypothesis) 。 

沃 尔 夫 等 (Wolfe 等 ,1989a) 提 出 , 同 质 段 是 种 系 DNA 复制 期 间 , 由 于 前 体 核 苷 酸 库 中 的 组 成 变 
化 而 造成 的 突变 倾斜 所 引起 的 。 富 含 GC 的 同 质 段 由 在 种 系 细 胞 周期 的 早期 复制 的 DNA 区 域 所 扒 
带 , 而 在 那 一 期 间 前 体 库 有 较 高 的 GC 含量 ,因而 就 有 一 种 突变 成 GC 的 偏向 。 反 之 , 富 含 AT 的 同 质 
段 在 细胞 周期 的 晚期 复制 , 那 时 前 体 库 有 较 高 的 AT 含量 ,故而 有 一 种 突变 成 AT 的 倾向 。 我 们 称 它 
为 突变 论 者 的 假说 (mutationist hypothesis) 。 此 假说 是 根据 这 样 的 观察 而 作出 的 : 核 苷 酸 前 体 库 的 组 
成 在 细胞 周期 内 会 发 生变 化 ,而 这 些 变化 事实 上 能 导致 新 合成 的 DNA 中 碱 基 比 改变 (Leeds 等 ， 
1985 )。 必 须 清 楚 , 哺 乳 动物 基因 组 的 复制 是 一 个 相当 漫长 的 过 程 , 要 花 8 小 时 或 者 更 多 时 间 
(Holmquist , 1987). 

一 个 支持 选择 论 者 假说 的 理由 是 ,第 一 和 第 二 密码 子 位 置 上 GC 含量 的 增加 可 给 予 蛋 白质 以 热 
稳定 性 ,而 内 含 子 , 第 三 密码 子 位 置 和 不 翻译 区 中 GC 含量 的 增加 , 则 既 能 增加 原始 mRNA 转录 本 的 
热 稳 定性 ,又 能 稳定 染色 体 的 结构 ,后 者 或 许 是 通过 影响 DNA 一 蛋白 质 的 相互 作用 而 实现 的 。 事 实 
上 , 嗜 热 细菌 强烈 地 倾向 于 采用 富 GC 密码 子 的 情况 已 有 报导 ( 见 第 131 页 )。 然 而 , 温 血 肴 椎 动物 的 体 
温 要 比 嗜 热 细 菌 所 经 受 的 温度 低 得 多 ,所 以 ,对 关 椎 动物 的 蛋白 质 和 DNA 序列 的 进化 来 说 ,温度 可 
能 并 不 是 一 个 非常 重要 的 因素 。 

选择 论 者 假说 所 面临 的 一 个 困难 是 ,大 部 分 哺乳 动物 和 鸟 类 的 基因 是 低 GC 含量 的 这 样 一 个 事 
实 。 此 假说 也 不 能 解释 为 什么 有 些 重 复 基 因 有 着 相反 的 GC 含量 。 例 如 ,在 哺乳 类 中 ,8 一 珠 蛋 白 簇 是 
低 GC 的 ,而 一 珠 蛋 白 簇 则 是 语 GC 的 (图 8 一 8) ,尽管 这 两 类 珠 蛋 白 基 因 是 在 同一 细胞 内 、 同 一 时 间 
里 表达 的 , 且 有 着 同样 的 功能 .类 似 地 ,有 些 免 疫 球 蛋 白 基 因 位 于 富 GC 区 ,而 另 一 些 则 位 于 富 AT 区 
(KL Aota 和 Ikemura, 1986) .贝尔 纳 迪 等 (Bernardi 等 ,1985,1988) 的 解释 是 , 同 质 段 代 表 选 择 的 单 
位 ,而 哺乳 动物 中 的 o RE KD BIT BGC E.G ER A EK GC 同 质 段 中 。 根 据 这 一 理由 ， 
鸡 中 的 和 8B 复 应 该 都 被 易 位 到 富 GC 同 质 段 了 。 然 而 ,这 一 理由 却 引 出 了 一 个 富 GC 同 质 段 的 功能 
优势 问题 .如 果 这 一 优势 不 是 来 自 它 所 含有 的 基因 ,那么 它 来 自 何方 呢 ? 

突变 论 者 的 假说 能 解释 哺乳 类 基因 组 中 一 和 8 一 珠 蛋 白 簇 间 GC 含量 上 有 较 大 差异 的 成 因 , 即 
假定 它们 分 别 位 于 早期 和 晚期 复制 的 区 域内 。 不 过 , 它 也 面临 着 一 些 困 难 (Bernardi 等 ,1988) 。 例 如 ， 
结构 异 染 色 质 ,如 卫星 DNA ,大 多 数 是 富 GC 的 ;而 功能 异 染 色 质 ,如 非 活 性 的 X 染色体, 在 细胞 周期 
的 尾声 阶段 复制 ;在 这 些 情 况 下 , 核 苷 酸 库 和 DNA 组 成 上 的 变化 间 看 不 到 有 什么 联系 。 

结论 是 , 现 有 的 资料 看 来 还 不 足以 对 这 两 种 假说 加 以 评判 .也 有 可 能 突变 压力 和 自然 选择 两 者 ， 
都 在 形成 温 血 肴 椎 动物 基因 组 的 组 成 上 的 组 织 化 中 起 着 作用 。 


习题 


1、 表 8 一 5 列 出 了 4 种 原生 动物 的 基因 数 , 平 均 基 因 大 小 的 大 致 估 值 和 C 值 .(a) 假 定 基 因 组 的 基 
因 部 分 仅 由 为 蛋白 质 编码 的 基因 构成 ,那么 ,每 一 种 生物 中 非 基 因 DNA 的 比例 是 多 少 ?(b) 基 因 组 大 
小 和 非 基 因 DNA 的 比例 间 存 在 某 种 关系 吗 ?( 注 意 C 值 以 pg 一 微微 克 为 单位 )。 


表 8 一 5 4 种 原生 动物 的 前 体 mRNA 的 平均 大 小 和 数目 的 大 致 估 值 和 C 值 


物种 基因 组 大 小 (pg) 基因 大 小 ( 核 苷 酸 ) 基因 数 
Physarum polycephalum 0. 57 1500 20000 
Oxytricha nova 0.4 2200 24000 
Euplotes aediculatus 0. 3 1800 40000 
Dictyostelium discoideum 0. 036 1500 6500 


资料 取 自 Cavalier-Smith(1985) 。 

2、 表 8 一 6 列 出 了 4 种 生物 的 前 体 mRNA 和 成 熟 mRNA 的 平均 大 小 的 大 致 估 值 和 C 值 .C AEN 
差异 ,能 用 这 些 生 物 的 基因 间 在 非 编 码 区 的 大 小 上 存在 差异 来 加 以 解释 吗 ?( 注 意 C AW pg 为 单位 
给 出 )。 

表 8 一 6 4 种 动物 的 平均 基因 大 小 和 mRNA 大 小 的 大 致 估 值 和 C 值 


属 基因 组 大 小 (pg) 前 体 mRNA 大 小 ( 核 苷 酸 ) mRNA 大 小 ( 核 苷 酸 ) 
Drosophila( # #8 ) 0.18 4200 2100 
Aedes ( 8X ¥ ) 0. 837 8400 2100 
Strong ylocentrotus (3% fA) 0. 89 8800 2100 
Homo(\) 3. 50 10000 2100 


资料 取 自 Cavalier-Smith(1985) 。 
a\ 不 同 物种 平均 后 得 到 的 值 。 


3 假定 在 某 一 生物 中 ,整个 基因 组 都 是 由 为 蛋白 质 编码 的 基因 所 构成 ,20 种 氮 基 酸 以 相等 的 频率 
使 用 ,(a) 如 果 同 义 密码 子 的 选取 由 尽 可 能 导 至 最 高 GC 含量 的 选择 所 决定 ,那么 这 种 生物 的 GC 含 


量 将 是 多 少 ?(b) 如 果 同 义 密码 子 的 选取 由 尽 可 能 导致 最 低 GC 含量 的 选择 所 决定 ,那么 这 种 生物 的 


GC 含量 又 是 多 少 。 
4、 假 定 在 某 一 DNA 序列 中 ,每 核 背 位 点 每 世代 的 替换 速率 从 G 或 C 到 工 或 A 为 则 从 A 或 工 
到 G 或 C 为 v。 设 Pt 是 世代 t+ 时 G 和 C 核 苷 酸 在 该 序列 中 的 比例 .那么 ,GC 在 下 一 世代 中 的 比例 为 
下 
根据 这 一 等 式 , 证 明 平 衡 点 GC 比例 由 等 式 8. 1 给 出 。 
5、 如 果 某 一 序列 的 起 始 GC 会 量 为 Po, 则 可 证 明 世 代 t 时 的 GC 比例 由 下 式 给 出 : 


ern A 
tara gee ort ore ut+uv 


(AE u=3X10°°, v=5X10*, A P,)=0. 20,18 t=10° HA Pt A. EXHAH PE GCCSBENBEK 
是 一 个 缓慢 过 程 还 是 一 个 快速 过 程 ? 
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第 二 章 
2g (Woe Wy) 
和 a” Gat ee 
4. @)P,=9. 776 X10 *; (bP. —0, 2467 .—9. 778 X10" 
5. N./N=8/9 
6. N.=59. 701 
7.P=s17e9 X10‘ 
8. (a) 1-s A 2-s 19 aS KS Al, A 2; =2/3,2,=1/3, A m= 1. 729X10 *; (-b)x=3. 891K 10-3 


第 三 章 


6. (a) P,=0. 615; (b) Pa=0. 244, 
9. 4r=4N,(a)K=0. 061 f(b) K=0. 056 
“4 r=6 WY,(a)K=0. 041 #l(b)K =0. 037 


# 


2. fi K, =0.012,K, =0. 048 #l Ky =0. 295 HH 

3. (a) LH K = 0.076 PH; (b) HLA K = 0.075 替换 。 

4. 小 鼠 序列 的 进化 比 大 鼠 序列 的 快 1.63 倍 。 

5. (a) BEF BEAL Pinas = 0.057 FR; (Cb) BF BLE nin = 0.004 FR, 
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(b) 


(c) 5 (b) FA fA . 
Ca) 


(a) (d) (c) (b) (e) (f) 


TES Pi} 8 
《c) 和 (d) 不 形成 一 个 进化 枝 。 
\b) 得 到 两 个 同样 节省 的 树 : 


上 II 
(a) (e) (b) (c) (f) (b) (c) (e) (a) (f) 


PY HP Te) Hy Bb). Cc) A (Ce) HG R— THE LK I EG Balle Jp Ee - i 
Ba 


ik 


2. (ad 47 个 非 简 并 位 点 和 13 个 四 重 简 并 位 点 ;(b)70 个 非 简 并 位 点 且 无 四 重 简 并 位 点 ;(c) 所 有 
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72 个 位 点 都 是 非 简 并 的 。 
3.(a)5;(b)6, 
4. (b)17. 24X10 4, 


第 八 章 


1. (a) Physarum polycephalum ,5. 37% ;Oxytricha 7ova，13. 46% ; Euplotes aediculatus, 24. 48% ; 
Dictyostelium discoideum ,27. 637% ; (b) 3é A 4A K7) 5 ESE DNA 所 占 比 例 之 间 存 在 着 负 相 关 。 

3. (a)56.76%;(b)30. 00% 

5. P,=0. 43 “ 
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A(1)#E DNA K RNA ARE RH, DERARAA AR. 

acceptor site 受 体 部 位 。 内 含 子 的 3) tig. 

active site 活性 部 位 。 一 种 蛋白 质 , 通 常 为 一 种 酶 中 的 部 位 ,其 结构 完整 性 为 行使 功能 (例如 基质 
结合 ) 时 所 必 不 可 少 的 。 

additive tree 加 性 的 树 。 一 种 系统 树 ,其 中 任何 两 个 终端 节点 间 的 距离 等 于 将 它们 联结 起 来 的 枝 
长 之 和 。 

advantageous mntation 有 利 突 变 。 一 种 能 增加 其 携带 者 的 适合 度 的 突变 。 

alignment 线性 排比 。 为 了 找 出 缺失 和 插入 的 位 置 而 将 两 同 源 序 列 进行 配 比 似 的 排列 。 

allele(allelomorph) 等 位 基因 (等 位 基因 型 )。 一 个 基因 座位 上 可 供 选择 的 基因 形式 。 

allele frequency (gene frequency) 等 位 基因 频率 (基因 频率 )。 和 群体 中 某 一 给 定 基 因 座 位 上 某 一 等 位 
基因 拷贝 所 占 的 百分比 。 

allozyme(allelozyme) 异 型 酶 (等 位 酶 )。 一 种 酶 的 某 种 等 位 形式 。 

alternative splicing 选择 性 拼接 。 通 过 采用 不 同 的 受 体 和 给 体 部 位 ,而 从 一 种 前 体 一 mRNA 序列 
产生 出 两 种 或 多 种 mRNA 分 子 。 

amino acid 氨基 酸 。 一 种 具有 通 式 R-CHCNH;)COOH 的 有 机 分 子 , 既 有 碱 性 基 团 (NH,) 又 有 酸性 
基 团 (COOH) ,还 有 为 各 种 氨基 酸 所 特有 的 侧 链 基 团 (R)。 蛋 白质 的 亚 单位 和 结构 砖 块 。 

amino terminal(N-terminal) 氨基 末端 CN 一 末端)。 一 个 多 肽 的 NH2: 端 。 

amplification 扩 增 。 某 一 基因 或 DNA 序列 的 拷贝 数 的 大 幅度 增加 ,增加 量 超 出 了 作为 该 生物 单 
倍 体 基 因 组 的 特征 所 具有 的 量 。 

analogy 类 似 。 由 趋同 进化 、 而 不 是 由 共同 的 进化 祖先 所 导致 的 相似 。 

aneuploidy (chromosomal duplication ) 非 整数 倍 重复 (染色 体重 复 )。 存 在 着 额外 染色 体 , 以 至 一 个 
细胞 的 染色 体 组 成 不 是 单 倍 体 组 的 整数 倍 。 

anticodon 反 密 码 子 。tRNA 分 子 中 的 核 苷 酸 三 联 体 ,在 翻译 期 间 通 过 互补 碱 基 配 对 而 与 mRNA 
中 的 特定 密码 子 结合 ,从 而 在 翻译 期 间 确定 某 一 具体 氨基 酸 的 位 置 。 

antiparallel 反 向 平行 。DNA 双 螺 旋 的 两 条 互补 链 的 相反 取 回 。 

apoprotein 脱 辅 基 蛋 白 。 一 种 没有 为 其 功能 所 必需 的 辅酶 、 辅 因子 和 辅 基 的 蛋白 质 ( 例 如 载 脂 蛋 
A). 

archaebacteria 古 细菌 。 细 胞 壁 中 不 含 胞 壁 酸 的 原核 生物 , 是 一 个 高 度 多 样 化 的 类 群 ,包括 产 甲烷 
细菌 , 嗜 热 、. 嗜 酸 的 菌 和 嗜 盐 ( 在 高 盐 浓 度 中 生活 ) 菌 , 据 推 测 是 生物 界 3 个 原始 的 后 代 品 系 之 一 。 

arithmetic mean 算术 平均 。n 项 之 和 用 mn 来 除 。 

asymmetrical exon 不 对 称 外 显 子 。 两 侧 由 不 同 相 位 类 型 的 内 含 子 所 夹 拥 的 外 显 子 。 

autosome 常 染色 体 。 除 性 染色 体外 的 任何 一 种 染色 体 。 

back (backward) mutation 回复 突变 。 使 某 一 核 苷 酸 位 点 回复 到 以 前 状态 的 突变 。 

bacteriaphage( 缩 写 为 phage) 叭 菌 体 。 寄 生 于 细菌 中 的 病毒 。 

balanced polymorphism 平衡 多 态 。 一 种 长 时 期 内 稳定 而 由 平衡 选择 来 维持 的 多 态 。 

balancing selection 平衡 选择 。 其 结果 造成 群体 中 某 一 基因 座位 上 维持 着 两 个 或 多 个 等 位 基因 的 
选择 体制 (例如 超 显 性 )。 

banding 分 带 。 染 色 体 上 明和 暗 地 染 色 区 域 。 


base( 见 nucleotide) 碱 基 。 

base pair 碱 基 对 。(1) 某 一 核酸 中 一 条 链 上 的 核 苷 酸 , 按 嗓 叭 与 喀 啶 间 的 配对 规则 与 另 一 条 链 上 
的 核 苷 酸 形成 氢 键 。(2) 度 量 双 链 DNA 长 度 的 单位 。 

biased codon usage( 见 unequal codon usage) 倾 向 性 的 密码 子 应 用 。 

bifurcation (dichotomy) 两 分 又 (两 分 枝 )。 系 统 树 中 一 次 物种 形成 的 进化 事件 的 图 形 表 示 ,和 藉 此 一 
个 祖先 分 类 单位 分 裂 为 二 。 

bottleneck 瓶颈 。 和 群体 大 小 上 的 锐 减 。 

box 块 ( 框 )。 邻 近 或 位 于 某 一 基因 内 的 短 DNA 序列 ,起 着 某 种 调控 作用 (例如 TATA #). 

branch 分 枝 。 系 统 树 中 某 种 进化 关系 的 图 形 表 示 。 

C (1) 在 DNA 或 RNA 中 为 胞 喀 啶 核 苷 ,(2) 在 蛋白 质 中 为 半 胱 氨 酸 。 

C 一 terminal( 见 carboxy terminal) C 一 末端 。 

C value(genome size)C 值 ( 基 因 组 大 小 ) 。 某 一 物种 的 单 倍 体 基 因 组 所 具有 的 特征 性 DNA 的 量 。 

C 一 value paradox C- 值 矛盾 (C- 值 悖 论 ) 。C 一 值 和 形态 学 复杂 性 水 平 间 明 显 地 缺乏 相关 性 的 现 
象 。 

capping 戴 帽子 。 真 核 生 物 中 前 体 mRNA 的 5' 端 的 修饰 过 程 ,在 此 过 程 中 GTP 经 5-5' 三 磷酸 刍 
而 加 入 到 该 分 子 之 中 。 

cap site(transcription initiation site) 帽 子 部 位 (转录 起 始 部 位 )。 在 DNA 中 是 转录 开始 的 部 位 ,在 
RNA 中 是 mRNA 成 熟 过 程 期 间 被 加 上 帽子 的 部 位 。 

carboxy terminal(C-tenninal) 羧 基 末 端 (C 一 未 端 )。 一 个 多 肽 的 COOH 端 。 

carrying capacity 负载 力 、 容 纳 量 。 在 一 个 有 限 的 栖息 地 中 , 某 一 给 定 物 种 所 能 维持 的 最 大 个 体 
数 。 

catalyst 催化 剂 。 一 种 能 降低 某 一 化 学 反应 所 需要 的 活化 能 , 却 不 被 该 反应 所 消耗 或 改变 的 化 合 
物 。 

cDNA( 见 complementary DNA) 

census population size( 见 papulation size) 统 计 记 录 的 群体 大 小 。 

central dogma 中 心 法 则 。 以 DNA 为 遗传 物质 的 生物 中 、 信 息 流 动 的 路 线 CDNA->~RNA 一 蛋白 
质 ) 。 

chimeric protein( 见 mosaic protein) # @ & A Jit . 

chloroplast 叶绿体 。 一 种 含 叶 绿 素 的 .由 膜 包 被 的 细胞 器 , 它 是 植物 和 某 些 原生 生物 的 细胞 中 进 
行 光合 作用 的 场所 。 

chromatid 染色 单 体 。(1) 由 染色 体 复 制 而 产生 的 两 个 拷贝 之 一 。(2) 构 成 该 染色 体 的 两 个 双 链 
DNA 分 子 之 一 。 

chromosomal duplication( 见 aneuploidy ) 4 f& fA HZ 。 

chromosome 染色 体 。 在 原核 生物 中 指 包含 基因 组 的 DNA 分 子 。 在 真 核 生 物 中 , 指 线性 DNA 分 
子 与 蛋白 质 复 合 而 形成 的 含有 遗传 信息 的 线 状 结构 。 

cis 顺 。 两 个 序列 或 基因 位 于 同一 染色 体 上 的 排列 。 

clade 进化 枝 。(1) 按 严格 定义 , 即 由 一 个 物种 及 其 所 有 代表 着 进化 树 上 的 一 个 单 系 分 枝 的 后 代 所 
构成 的 某 一 分 类 单位 。(2) 若 较 不 严格 地 应 用 , 则 在 前 面 的 范围 中 可 将 不 代表 该 分 枝 的 后 代 除 外 。 
(3) 关 于 现存 生物 , 即 指 在 所 考虑 的 一 大 群生 物 中 ,一 个 有 共同 祖先 的 亚 群 ,该 共同 祖先 不 是 此 群 中 其 
他 生物 的 祖先 。 

cladogenesis( 见 speciation ) 分 枝 进 化 、 系 统 发 生 。 

cladogram 进化 分 枝 图 、 进 化 树 。 描 绘 或 力图 描绘 一 些 群 体 、 物 种 ,或 更 高 的 分 类 单位 间 的 进化 关 
系 的 图 形 表示 。 

classification( 见 taxonomy) 分 类 。 

coding region 编码 区 ( 域 ) 。 一 个 为 蛋白 质 编码 的 基因 中 ,最 终 将 被 翻译 的 所 有 外 显 子 部 分 。 
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codominance(genic selection) ) 共 显 性 (基因 选择 )。 二 倍 体 基因 组 中 某 一 基因 座位 上 的 两 个 等 位 基 
因 对 适合 度 有 等 同 的 贡献 。 

codon 密码 子 。mRNA 中 相 邻 核 苷 酸 构成 的 三 联 体 ,为 由 某 一 特定 tRNA 携带 的 氨基 酸 编码 ,或 
者 确定 翻译 过 程 的 终止 。 

codon family 密码 子 族 。 所 有 为 同一 氨基 酸 编码 的 密码 子 , 它 们 相互 间 仅 在 第 三 密码 子 位 置 上 有 
差异 (例如 ,为 亮 氨 酸 编码 的 6 个 密码 子 中 ,UUA 和 UUG 组 成 一 个 族 ,CUU、CUC、CUA 和 CUG 则 
组 成 另 一 族 ) 。 

codon usage 密码 子 应 用 。 一 个 密码 子 族 中 的 成 员 在 为 蛋白 质 编码 的 基因 中 被 使 用 的 频率 。 

coenzyme 辅酶 。 一 种 不 与 酶 结合 ,但 作为 一 种 电子 、 原 子 或 原子 基 团 的 中 间 载 体 而 为 该 酶 的 功能 
所 必需 的 非 蛋 白质 有 机 分 子 。 

cofactor 辅 因 子 。 为 某 种 酶 行使 功能 所 必需 的 无 机 分 子 。 

coincidental evolution( 见 concerted evolution ) 并 发 进化 。 

coincidental substitution 并 发 蔡 换 。 两 同 源 序列 中 的 同一 核 苷 酸 位 点 上 发 生 的 两 个 替换 。 

colinearity 线性 对 应 。 无 内 含 子 基 因 的 DNA 顺序 和 其 所 编码 蛋白 质 的 氨基 酸 顺 序 间 的 精确 对 


complementarity 互补 (性 )。 双 链 DNA、 双 链 RNA 或 DNA 一 RNA 双 链 中 核 苷 酸 的 反 向 平行 配 


complementary DNA(CcCDNA) 互 补 DNA。 以 RNA 为 模板 由 反 转 录 酶 合成 的 DNA。 

complex(composite)transposon 复合 (合成 ) 转 座 子 。 两 侧 由 两 个 完整 而 独立 的 可 转 座 插 人 序列 夹 
拥 的 转 座 子 。 

compositional assimilation 组 成 同化 。 假 基因 中 由 于 点 突变 的 积累 最 终 抹 掉 了 它 与 产生 它 的 功能 
基因 间 的 顺序 相似 性 ,从 而 使 其 核 苷 酸 组 成 与 其 邻近 DNA 序列 的 相似 。 

‘concerted evolution (horizontal evolution ,coincidental evolution ) 协 同 进 化 (水 平 进 化 、 并 发 进化 )。 
一 个 物种 中 某 一 基因 家 族 的 成 员 间 核 苷 酸 序列 的 同 质 性 的 维持 ,尽管 核 苷 酸 序列 随 着 时 间 而 改变 。 

conditional fixation time 条 件 固定 时 间 。 一 个 最 终 将 会 在 群体 中 固定 的 突变 型 等 位 基因 达到 固定 
的 时 间 。 

consensus sequence 共同 顺序 。 在 许多 同 源 序列 中 ,每 一 个 位 点 上 都 代表 了 占 绝 大 多 数 的 核 苷 酸 
或 氨基 酸 的 那 种 顺序 。 

conservative substitution 保守 替换 。 某 一 氨基 酸 被 另 一 个 有 相似 的 化 学 性 质 的 氨基 酸 蔡 换 。 

conservative transposition 保守 (型 ) 转 座 。 可 转 座 因子 不 复制 而 从 一 个 基因 组 位 置 移 到 另 一 个 位 
置 的 运行 。 

constant site or constant region 恒定 位 点 (不 变 位 点 ) 或 恒定 区 。 在 所 有 被 比较 的 同 源 序列 中 ， 


DNA 内 由 同样 的 核 苷 酸 占据 的 位 点 或 区 域 。 


convergence 趋同 。 相 似 的 遗传 或 表 型 性 状 的 独立 进化 。 

convergence substitution 趋同 替换 。 在 两 同 源 序列 中 的 同一 核 苷 酸 位 点 上 ,两 个 不 同 的 核 苷 酸 由 
同一 核 苷 酸 所 替换 。 

crossing-over 交换 。 两 同 源 染 色 体 间 导 致 连锁 基因 重组 的 遗传 物质 交换 的 过 程 。 假定 该 过 程 是 两 
染色 体 先 在 同 源 位 点 处 断裂 ,然后 交换 、 接 着 重新 连结 而 完成 。 

cyanobacteria 蓝 细菌 。 具 有 光合 作用 能 力 的 一 类 光合 真 细 菌 。 以 往 称 蓝 绿 藻 。 

D 天 冬 氨 酸 。 

Darwinian fitness( 见 fitness) 达 尔 文 适合 度 。 

decoding( 见 translation) 解 码 。 

degenerate code 简 并 密码 。 一 种 遗传 密码 ,其 中 有 意义 密码 子 的 数目 大 于 氨基 酸 总 数 , 结 果 有 些 
氨基 酸 将 由 一 个 以 上 的 密码 子 来 确定 。 所 有 已 知 的 遗传 密码 都 是 简 并 的 。 

degenerate site 简 并 位 点 。 一 个 密码 子 中 能 由 一 个 以 上 的 核 代 酸 占据 而 仍 为 同样 的 氨基 酸 编码 的 
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degree of divergence 岐 化 程度 。 两 同 源 序 列 相 互 间 的 差异 程度 。 

deleterious mutation 有 害 突变 。 降 低 其 携带 者 的 适合 度 的 突变 。 

deletion 缺失 。 从 某 一 DNA 序列 中 移 去 了 一 个 或 多 个 碱 基 。 

denaturation 变性 。 和 蛋白 质 的 三 级 结构 的 丧失 。 有 时 被 用 作 DNA 熔 解 的 同义词 。 

deoxyribonucleic acidCDNA) 脱 氧 核糖 核酸 。 核 苷 酸 连 结 而 成 的 一 种 大 分 子 聚 合 物 ,其 中 糖 基 为 脱 
氧 核糖 。 通 常 是 双 链 的 。 在 所 有 真 核 生 物 和 原核 生物 中 ,以 及 许多 病毒 中 , 它 是 遗传 信息 的 携带 者 。 

deterministic process 决定 性 过 程 。 其 结果 能 从 有 关 起 始 条 件 的 知识 来 精确 地 预测 的 过 程 。 

diagnostic position ( 见 informative site) 判 定位 置 。 

dichotomy( 见 bifurcation ) 两 分 枝 。 

digestion 消化 ` 水 解 。 双 链 DNA 被 某 一 限制 性 内 切 核酸 酶 所 切割 。 

diploid 两 倍 体 。 一 套 染 色 体 ,其 中 每 种 染色 体 都 有 两 个 拷贝 。 

directional selection 定向 选择 。 按 一 种 特别 的 方向 ,或 者 走向 固定 或 者 走向 灭绝 ,来 改变 某 种 等 位 F 
基因 的 频率 的 选择 体制 。 4 

disjunction 去 联结 。 减 数 分 裂 期 间 同 源 染 色 体 的 分 离 ,或 有 丝 分 裂 期 间 互补 的 染色 单 体 的 分 裂 。 4 

distance( I, genetic distance) FE BS 。 

distance matrix 距离 矩阵 。 被 研究 的 类 群 中 各 分 类 单位 间 的 遗传 距离 值 组 成 的 矩阵 。 

divergence 分 岐 。 一 个 分 类 学 单位 分 成 两 个 的 分 梳 。( 还 可 见 sequence divergence) 

DNA( 见 deoxyribonucleic acid ) 

DNA-DNA hybridization DNA-DNA 杂交 。 形 成 异 源 的 DNA 双 链 。 

domain ( Ji, functional domain ) 域 。 

dominance 显 性 。 在 杂 合 子 中 某 一 等 位 基因 显示 其 完全 的 表 型 效应 的 性 质 

donor site 供 体 部 位 。 一 个 内 含 子 的 5 Site 

dose repetition 剂量 重复 。 某 一 DNA 序列 存在 着 多 重 拷贝 ,这 可 由 某 基 因 产 物 以 相对 于 单 拷贝 序 
列 而 言 呈 增加 量 的 形式 产生 来 表明 。 

dot matrix 点 (和 矩 ) 阵 。 一 种 序列 的 线性 排比 方法 ， 其 中 两 序列 分 别 写成 矩阵 的 首 列 和 首 行 、 而 点 
WAT AAR MO BAT BoP. 

downstream 下 游 。 一 个 核酸 上 的 某 一 参考 点 的 ITE. BRENT. 

drift( 见 random genetic drift) 2% . 

duplex 双 链 、 双 螺旋 。 一 个 双 链 DNA BK IL HE RNA ,或 一 个 由 单 链 DNA 与 RNA 分 子 互补 配对 而 
形成 的 双 螺 旋 。 

duplication 重复 ,复制 。 基 因 组 中 某 一 DNA 片段 的 两 个 拷贝 存在 或 产生 。 

duplicative transposition( 见 replicative transposition ) 复 制 型 转 座 。 

E#aAR. 
effective population size 有 效 群 体 大 小 。 与 随机 遗传 漂 变 有 关 的 群体 大 小 。 群 体 中 从 事 生殖 的 实际 
个 体 数 。 

electromorph 电泳 型 。 由 电泳 移动 性 差异 检 出 的 蛋白 质变 异型 ( 同 功 酶 或 异型 酶 ) 。 

electrophoresis 电泳 。 将 浴 解 的 或 胶体 的 颗粒 在 由 场 下 根据 它们 的 移动 性 分 离 的 技术 。 电 泳 移 动 
性 有 赖 于 该 颗粒 的 大 小 .三维 几 何 形状 和 电 和 荷 。 

endosymbiosis 内 共生 。 两 种 生物 间 的 互利 关系 ,其 中 一 种 生物 .内 共生 者 (endosymbiont) ,生活 在 
另 一 种 和 生物、 宿主 Chost) 的 组 织 或 细胞 内 。 

endosymbiotic theory 内 共生 学 说 。 该 学 说 认为 ,自我 复制 的 细胞 器 ,如 线粒体 和 叶绿体 ,原初 本 是 
自由 生活 的 生物 ,后 来 进入 有 核 的 细胞 并 与 之 建立 了 共生 关系 ,进而 失去 了 独立 生存 的 能 力 。 

enzyme 酶 。 能 催化 特异 化 学 反应 的 蛋白 质 或 蛋白 质 复合 物 。 

eubacteria 真 细 菌 。 细 胞 壁 中 挫 人 了 胞 壁 酸 的 原核 生物 。 即 除 古 细菌 外 的 所 有 细菌 。 生 物 界 中 三 
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个 原始 祖先 品系 之 一 。 

eukaryote 真 核 生物 。 具 有 一 个 真正 的 细胞 核 和 一 些 由 膜 包 被 的 细胞 器 的 生物 。 生 物 界 中 三 个 原 
始祖 先 品 系 之 一 。 

exon 外 显 子 。 基 因 的 一 个 DNA 片段 ,其 转录 本 在 成 熟 的 RNA 分 子 中 出 现 。 

exon duplication 外 显 子 重复 。 一 个 基因 内 的 某 一 外 显 子 的 重复 拷贝 的 产生 。 

exon insertion 外 显 子 插入。 一 个 或 多 个 外 显 子 从 一 个 基因 挫 人 到 另 一 个 基因 子 。 

exon shuffling 外 显 子 混 义 。 严 格 地 讲 指 外 显 子 重复 和 外 显 子 插 入 。 常 常 与 外 显 子 插入 同 义 地 应 


expected heterozygosity( 见 heterozygosity, gene diversity) 期 望 杂 合 度 、 预 期 杂 合 度 。 

extinction 灭绝 。 一 个 进化 谱系 的 终止 。 

FARA AR. 

fecundity 生殖 力 。 一 种 适合 度 分 量 。 某 一 给 定 基因 型 每 个 体 的 生育 数 或 产 卵 量 。 

fertility 能 育 性 。 一 种 适合 度 分量 。 某 一 给 定 基因 型 每 个 体 的 成 活 后 代数 。 

fitness (Darwinian fitness) 适 合 度 (达尔 文 适 合 度 ) 。 某 一 个 体 或 某 一 基因 型 的 生存 和 繁殖 上 的 相 
对 成 就 的 测度 。 某 一 个 体 或 某 一 基因 型 对 将 来 世代 的 相对 贡献 。 

fixation 固定 。 当 某 一 等 位 基因 在 群体 中 的 频率 达到 100% 时 所 出 现 的 情况 。 一 个 两 倍 体 群 体 中 
的 所 有 成 员 对 同一 等 位 基因 而 言 都 是 纯 合 的 时 的 情况 。 

fixation probability 固定 概率 。 某 一 特定 等 位 基因 将 在 群体 中 固定 的 可 能 性 。 

fixation time 固定 时 间 。 某 一 突变 型 等 位 基因 在 群体 中 达到 固定 所 花 的 时 间 。 

flanking sequence 侧 ( 区 ) 序 列 。 被 转录 基因 的 5' 和 3' 端 处 的 不 转录 序列 。 

foldback DNA 8 Sif # DNA。 含 有 完美 或 接近 完美 回 文 的 DNA , 当 其 为 单 链 时 可 通过 自身 折 回 
而 形成 发 夹 状 的 结构 。 

fourfold degenerate site 四 重 简 并 位 点 。 密 码 子 中 的 一 个 核 苷 酸 位 点 ,在 该 位 点 上 一 切 可 能 的 替换 
都 是 同 义 的 。 

frameshift mutation 阅读 框架 移动 突变 。 一 种 扰乱 了 为 蛋白 质 编码 基因 的 阅读 框架 的 突变 。 一 个 
DNA 片段 的 缺失 或 插入 , 当 该 片段 的 长 度 不 是 3 或 3 的 倍数 个 核 苷 酸 时 , 即 可 造成 这 类 突变 。 

frameshifted protein 阅读 框架 移动 后 的 蛋白 质 ,由 于 阅读 框架 变 得 与 基因 的 原初 或 主要 阅读 框 
架 不 同 ,而 编码 出 一 种 完全 或 部 分 地 不 同 的 蛋白 质 。 

functional constraint (selective constraint) 功 能 限制 (选择 限制 )。 一 个 位 点 或 一 个 基因 座位 对 核 苷 
酸 蔡 换 所 具有 的 特征 性 忍受 程度 。 

functional domain(domain) 功 能 域 ( 域 ) 。 蛋 白质 内 的 一 个 界限 明确 的 区 域 ,能 行使 某 一 特殊 的 功 
能 。 它 可 能 不 是 由 连续 的 氨基 酸 段 所 构成 ,虽然 就 所 涉及 的 蛋白 质 的 三 级 结构 而 言 , 它 几乎 总 是 由 那 
些 相互 邻近 的 氨基 酸 所 构成 。 

GD 在 DNA 或 RNA 中 为 鸟 味 叭 ,(2) 在 蛋白 质 中 为 甘氨酸 。 

gamete 配子 。 具 单 倍 体 数 染 色 体 的 生殖 细胞 。 

gap 裂 篷 。 一 段 插入 或 缺失 。 在 序列 线性 排比 中 则 为 一 个 含有 空缺 碱 基 的 对 子 。 

gap penalty 裂 颖 处 罚 。 与 点 替换 发 生 的 频率 相 比 裂缝 事件 在 进化 中 发 生 的 频 度 如 何 ? 对 此 问题 作 
出 的 估价 即 裂 矣 处 罚 。 在 线性 排比 算法 上 ,或 者 用 一 个 因子 来 乘 以 裂 锋 的 总 长 度 , 或 者 将 某 一 给 定 长 
度 有 裂 矣 的 数目 乘 以 一 个 函数 ,应 用 这 些 值 才 有 可 能 对 裂 锋 和 替换 加 以 比较 。 

gene 基因 。 基 因 组 DNA 或 RNA 中 的 一 个 序列 , 它 是 某 一 特别 功能 的 根本 。 

gene conversion 基因 转变 。 一 种 非 相 互 重组 过 程 , 结 果 是 一 个 序列 变 得 与 另 一 序列 等 同 。 

gene duplication 基因 重复 。 广义 地 , 指 一 个 DNA 序列 的 两 个 拷贝 产生 。 狭义 而 言 , 指 一 个 完整 的 
基因 序列 的 重复 。 

gene family( 见 multigene family) 基 因 家 族 。 

gene frequency( 见 allele frequency) 基 因 频 率 。 


gene pool 基因 库 。 一 个 有 性 生殖 的 群体 中 的 所 有 基因 。 

gene sharing 基因 分 享 。 一 个 基因 在 不 重复 且 失 去 其 原始 功能 的 前 提 下 ,获得 并 维持 第 二 种 功能 
的 现象 。 

gene substitution 基因 替换。 一 种 过 程 , 厌 此 一 个 新 的 突变 型 等 位 基因 在 群体 中 达到 固定 。 

gene tree 一 种 由 来 各 每 物种 的 一 个 或 几 个 基因 构成 的 系统 树 。 

generation time 世代 时 间 。 两 个 连续 世代 之 间 的 平均 时 间 间 隔 。 有 时 定义 成 双亲 在 生产 其 顺序 处 
在 中 间 的 孩子 时 ,所 具有 的 平均 年 龄 。 

genetic code 遗传 密码 。 一 组 将 密码 子 翻译 成 氨基 酸 的 规则 。 

genetic distance(distance) 遗 传 距 离 (距离 )。 广 义 地 , 指 个 体 、 群 体 , 或 物种 间 遗 传 差 异 程度 的 几 种 
测度 中 的 任何 一 种 。 对 分 子 进 化 而 言 , 则 是 两 同 源 DNA 序列 自分 岐 以 来 ,它们 间 累 积 的 每 核 苷 酸 位 
点 的 核 苷 酸 蔡 换 数 的 测度 。 

genetic drift( 见 random genetic drift) 遗 传 漂 变 。 

genetic polymorphism( 见 polymorphism) ) 遗 传 多 态 性 现象 。 

genetic DNA 基因 (的 )DNA。 基 因 组 中 含 基 因 的 部 分 。 

genetic selection (J, codominance) 基 因 选 择 。 

genome 基因 组 。 由 一 个 细胞 或 个 体 所 携带 的 整套 遗传 物质 。 

genome doubling( 见 polyploidy) 基 因 组 加 倍 。 

genome duplication( 见 polyploidy) 基 因 组 重复 。 

genome size( 见 value) 基 因 组 大 小 。 

genomic compartmentalization 基因 组 的 区 域 化 。 指 细胞 中 独立 地 复制 的 基因 组 的 存在 。 通 常 , 指 
细胞 需 的 基因 组 。 

genotype 基因 型 。 某 一 生物 的 特别 的 等 位 基因 组 成 ,包括 那些 不 在 表 型 水 平 上 表现 出 来 的 等 位 基 
因 。 常 常 指 被 研究 的 一 个 或 少数 几 个 基因 的 等 位 基因 组 成 。 

geometric mean 几何 平均 ( 值 )。n 个 项 相 乘 以 后 开 mn 次 方 所 得 到 的 根 。 

germ-line cell 种 系 细 胞 ,生殖 细胞 。 精 细胞 或 卵细胞 ,或 一 个 它们 的 前 身 细胞 。 

HAAR. 

haploid 单 倍 体 。 具 有 一 套 不 成 对 的 染色 体 的 细胞 或 生物 。 

haploid set 单 倍 体 组 。 一 个 单 倍 体 细 胞 或 生物 中 的 染色 体 。 

haplotype 单 倍 型 。 一 条 染色 体 的 特别 的 等 位 基因 组 成 。 和 常常 指 被 研究 的 一 个 或 几 个 连锁 基因 的 
等 位 基因 组 成 。 

Hardy-Weinberg equilibrium 哈 迪 一 温 伯 格 平衡 。 一 个 两 倍 体 群 体 中 基因 型 的 频率 等 于 有 关 等 位 
基因 的 频率 之 积 的 局 面 。 

heteroduplex 异 源 双 链 。 两 条 链 各 来 自 不 同 个 体 的 双 链 核酸 分 子 。 

heterogeneous nuclear RNA (heterogeneous RNA. heteronuclear RNA, hnRNA) & WW A #-RNA 
(FR RNA, 5H RNA hnRNA), 4K PH RNA 转录 本 ,表示 rRNA .mRNA Al tRNA 的 前 体 和 
经 加 工 的 中 间 产 物 ,以 及 成 熟 但 未 传送 到 细胞 质 中 的 RNA 转录 本 。 

heterosis( 见 overdominance) Ay Ff ft # . 

heterozygosity 杂 合 度 、 杂 合 性 。 对 群体 中 遗传 变异 的 一 种 测度 ,可 用 杂 合 子 对 所 有 基因 座位 的 平 
均 频 率 算出 (观察 杂 合 度 ,observed heterozygosity) ,或 者 用 杂 合 子 在 一 个 处 于 哈 迪 一 温 伯 格 平衡 的 群 
体 中 预期 的 平均 频率 算出 (期 望 杂 合 度 ,expected heterozygosity, Kt A Bt .gene diversity), 

heterozygote 杂 人 合子。 在 被 研究 的 基因 座位 上 有 不 同等 位 基因 的 两 倍 体 个 体 。 

heterozygote advantage (hl, overdominance) 48 4 -F tit #* . 


higher taxon 高 级 分 类 单位 。 种 以 上 水 平 的 分 类 单位 。 


highly repetitive DNA 高 度 重复 的 DNA.。 由 平均 重复 成 百 上 千 次 的 序列 构成 的 基因 组 DNA 的 部 
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highly repetitire genes 高 度 重 复 的 基因 。 在 单 倍 体 基 因 组 中 出 现 许 多 拷贝 的 有 功能 基因 。 

homoduplex 同 源 双 链 。 一 种 双 链 DNA ,其 两 条 互补 的 链 来 自 同 一 个 体 。 

homology 同 源 (性 )。 因 有 共同 祖先 或 遗传 相关 而 类 似 。 

homozygote 纯 合 子 。 在 一 个 或 多 个 基因 座位 上 有 相同 的 等 位 基因 的 两 倍 体 个 体 。 

horizontal evolution( 见 concerted evolution ) 水 平 进化 

horizontal gene transfer 水 平 基 因 转 移 , 横 向 基因 转移 。 遗 传 信 息 从 一 个 基因 组 向 另 一 个 基因 组 的 
转移 ,特别 是 不 同 物种 间 的 转移 。 

hotspot of mutation 突变 (的 ) 热 点 .基因 组 DNA 的 一 个 片段 ,对 自发 的 或 某 种 特别 诱 变 剂 作 用 下 
的 突变 表现 出 较 高 的 倾向 性 。 

hybrid dysgenesis 杂种 劣势 。 一 组 相关 的 异常 症状 ,在 某 种 相互 作用 的 果 蝇 品系 间 的 一 种 类 型 的 
杂种 中 能 自发 地 诱 生 、 但 在 相反 类 型 的 杂种 中 则 不 出 现 。 

hybrid vigor( 见 overdominance ) AY FH fit # , AR FH YM HE 

hydrogen bond 氧 键 。 氢 原子 和 一 个 电 负 性 的 原子 .如 氧 、 之 间 的 弱 的 、 非 共 价 键 。 

hypervariable site or hypervariable region 高 可 变 部 位 或 高 可 变 区 域 。 展 示 出 超过 了 种 间 变 异性 的 
一 段 DNA 或 蛋白 质 。 如 此 大 的 变异 性 的 维持 ,通常 需要 该 基因 座位 经 受 某 种 形式 的 平衡 选择 ,如 超 
显 性 选择 。 

LEAR. 

independent assortment (Mendel’s second law) 独 立 分 配 ( 备 德尔 第 二 定律 ) 。 在 非 连锁 的 基因 座位 
中 ,一 个 座位 上 的 等 位 基因 的 分 离 与 另 一 个 座位 上 的 分 离 无 关 。 

inferred tree 推测 树 .推论 树 。 根 据 属于 现存 分 类 单位 的 经 验资 料 作出 的 系统 树 。 

informative site(diagnositic position ) 信 息 位 点 (判定 位 置 )。 用 于 从 所 有 可 能 的 系统 树 中 选取 最 节 
省 树 的 位 点 。 在 分 子 进化 中 ,是 其 中 至 少 有 两 种 不 同类 型 的 核 苷 酸 或 氨基 酸 , 且 它们 中 的 每 一 种 至 少 
在 两 个 序列 中 出 现 的 位 点 。 

initiation codon 起 始 密码 子 。 为 蛋白 质 编码 基因 的 阅读 框架 中 的 第 一 个 密码 子 ;: 通 常 , 在 真 核 生 物 
中 是 ATG 编码 的 甲 硫 氢 酸 ,在 原核 生物 中 则 编码 甲 酰 甲 硫 氮 酸 。 

in-phase overlapping 相位 内 重 肆 。 两 个 或 多 个 蛋白 质 按 同一 阅读 框架 翻译 的 现象 : 

insertion 插 人 。 一 个 或 多 个 核 苷 酸 揪 入 一 个 DNA 序列 中 的 突变 。 

insertion sequence 捅 和 人 序列。 一 种 除 带 有 转 座 所 必需 的 片段 外 不 带 任 何 遗传 信息 的 可 转 座 因 子 。 

internal gene duplication (partial gene duplication) 基 因 内 重复 (部 分 基因 重复 )。 基 因 内 的 重复 序 
列 , 由 比 整 个 基因 序列 小 的 有 关 重 复 所 派生 而 来 。 

internal node 内 部 节点 。 系 统 树 中 代表 某 一 祖先 生物 或 基因 的 图 形 。 

interon (intervening sequence) 内 含 子 ( 间 隔 序列 )。 一 种 可 转录 基因 的 DNA 片段 ,其 转录 本 在 
RNA 成 熟 的 过 程 中 被 除去 ,因而 不 出 现在 成 熟 的 RNA 分 子 中 。 它 位 于 外 显 子 之 间 。 

invariant repetition 不 变 重复 。 在 顺序 上 相互 等 同 或 几 近 等 同 的 重复 DNA 片段 的 存在 。 

inversion 倒 位 。 造 成 某 一 DNA 片段 极 性 颠倒 的 突变 。 

isoaccepting tRNA 同 受 体 tRNA, 同 功 tRNA。 人 能 携带 同样 氨基 酸 的 不 同类 型 tRNA. 

isochore 同 质 段 。 在 碱 基 组 成 上 同 质 的 基因 组 DNA Jr Be. 

isozyme(isoenzyme) 同 功 酶 。 有 相同 或 接近 相同 的 化 学 性 质 ,但 由 不 同 基因 座位 所 编码 的 一 些 不 
同型 式 的 酶 。 

junk DNA 废物 DNA。 基 因 组 DNA 中 的 无 功能 部 分 。 

K i AR. 

L 3AM. 

lagging strand 后 随 链 。 以 不 连续 方式 ,从 5 到 3' 沿 背离 复制 叉 的 方向 合成 的 DNA 链 。 

leading strand 前 导 链 。 以 连续 的 方式 ,从 5' 到 3' 沿 朝向 复制 叉 的 方向 合成 的 DNA 链 。 

length abridgment 长 度 缩短 。 假 基因 在 进化 期 间 由 于 缺失 超过 插 人 而 造成 的 逐渐 缩短 。 
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lethal mutation 致死 突变 。 造 成 其 纯 合 携带 者 死亡 或 不 育 的 突变 。 

ligation 连接 。 将 双 链 DNA 中 由 缺口 分 开 的 两 个 相 邻 碱 基 联 接 、` 而 形成 的 磷酸 二 酯 键 。 用 于 联接 
的 粘性 未 端 由 限制 性 内 切 核 酸 酶 水 解 产 生 。 连接 过 程 由 连接 酶 (ligase) 催 化 。 

LINE (Long INterspersed Element 的 首 字 母 缩 略 ) 长 散在 因子 。 一 种 散在 的 重复 序列 ,典型 的 
LINE 长 5000 碱 基 对 以 上 ,在 多 细胞 真 核 生物 的 基因 组 中 其 拷贝 数 为 10' 或 超过 10*。 又 称 长 的 散在 
重复 序列 。 

linkage 连锁 。 两 个 或 多 个 非 等 位 的 基因 位 于 相互 很 接近 的 位 置 处 ,并 倾向 于 一 起 遗传 的 现象 。 

localized repeated sequences 区 域 性 重复 序列 。 串 接 排 列 的 重复 序列 , 通 篆 由 短 的 单纯 重复 单位 所 
构成 (例如 卫星 DNA). 

locus( 复 数 loci) 基 因 座 位 。 染 色 体 上 某 一 特定 基因 或 DNA 片段 所 处 的 位 置 。 

lowly repetitive genes 低 度 重复 基因 。 在 单 倍 体 基 因 组 中 仅 以 几 个 拷贝 存在 的 基因 。 

M HAR. 

match 匹配 。 在 序列 排列 时 ,两 序列 的 同 源 位 置 上 存在 同样 的 碱 基 的 现象 。 

maturation KA, May mRNA 形成 mRNA。 

maximum parsimony(parsimony) 最 节省 (节省 )。 从 所 有 可 能 的 系统 树 中 选 出 所 需 蔡 换 数 最 少 的 
那 种 系统 树 , 以 它 作为 真实 系统 树 。 

meiosis (reduction division ) 减 数 分 裂 。 在 从 两 倍 体 细胞 产生 单 倍 体 配子 时 采用 的 真 核 细 胞 分 裂 过 
程 。 减 数 分 裂 的 特征 是 分 裂 后 染色 体 数 目 减 半 ,以 保证 每 个 配子 有 各 对 常 染 色 的 一 个 代表 和 一 半 性 染 
色 体 。 

meiotic drive( 见 segregation distortion ) 减 数 分 裂 驱 动 。 

melting fff. OEM ARR. WHR MA BHM KR. 

Mendelian segregation (Mendel's first law ,segregation ) ) 孟 德尔 ( 式 ) 分 离 ( 备 德尔 第 一 定律 、 分 离 )。 
杂 合 子 中 某 一 基因 对 的 两 个 不 同等 位 基因 在 减 数 分 裂 中 分 离 , 以 同样 比例 产生 两 类 配子 ,每 类 配子 各 
带 一 个 不 同 的 等 位 基因 。 

Mendelian second law( 见 independent assortment) 备 德尔 第 二 定律 。 

一 mer 表示 和 蛋白质 中 亚 基 数 的 后 缀 .前 缀 表示 亚 基 的 数目 (例如 , monomer, dimer, tetramer ,mul- 
timer ) ,或 单元 间 的 相似 性 (例如 ,homomer,heteromer) ,或 既 表 示 单 元 数目 又 表示 单元 的 类 型 (例如 ， 
homotrimer ,heteromultimer ) 。 

messenger RNACmRNA) 信 使 RNA。 从 某 种 初级 RNA 转录 本 加 工 而 成 RNA 分 子 , 用 于 合成 由 
氨基 酸 组 成 的 多 肽 的 翻译 中 。 

middle-repetitive DNA 中 (等 程 ) 度 重复 DNA。 基 因 组 DNA 中 ,长 度 相 对 较 长 .重复 数 平均 在 几 
十 次 到 几 百 次 之 间 的 那 一 部 分 序列 。 

migration 迁移 。 指 群体 遗传 学 中 个 体 或 基因 在 各 群体 间 的 移动 。 

mismatch 匹配 错误 。 在 顺序 的 线性 排比 中 ,两 序列 的 某 一 同 源 位 置 上 有 不 同 碱 基 的 现象 。 

missense mnutation( 见 nonsynonymous mnutation ) 误 义 突 变 。 

mitochondrion (复数 mitochondria) 线 粒 体 . 真 核 细胞 中 一 种 含 DNA 的 细胞 器 , 它 用 一 种 需 氧 的 
电子 传递 系统 ,把 由 食物 分 子 分 解 所 得 到 的 化 学 能 转换 成 ATP 储 能 。 

mitosis 有 丝 分 裂 。 真 核 细 胞 的 分 裂 模式 ,通过 这 种 分 裂 能 产生 两 个 具有 与 亲本 细胞 同样 染色 体 
套 的 子 细胞 。 

mobile element (J, transposable element) 可 ( 移 ) 动 因子 。 

moderately repetitive genes 适度 重复 基因 。 单 倍 体 基 因 组 中 具有 适度 拷贝 数 的 基因 。 

module(struclural domain) 组 件 ( 结 构 域 ) 。 球 状 蛋白 质 中 的 、 某 个 结构 上 独立 的 .稳定 的 \ 且 紧密 
的 室 间 单位 。 该 单位 能 与 其 他 部 分 相 区 别 ,通常 是 由 一 段 连续 的 氨基 酸 段 所 组 成 。 

molecular clock 分 子 ( 时 ) 钟 。(1) 指 突变 在 某 一 给 定 基因 组 片段 中 积累 的 速率 。(2) 指 假说 , 即 就 
在 一 给 定 基 因 或 DNA 序列 而 言 , 突 变 在 所 有 进化 谱系 中 以 接近 恒定 的 速率 积累 ,只 要 该 基因 或 该 
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DNA 序列 保留 其 原初 功能 。 将 该 时 钟 用 于 所 有 基因 和 所 有 生物 的 推广 尚 有 争议 。 

monomorphic 单 态 (性 ) 的 。 一 个 群体 中 所 有 个 体 在 某 一 基因 座位 上 实际 上 有 同样 的 等 位 基因 , 则 
称 是 单 态 的 。 

monophyletic 单 源 的 。 享 有 一 个 共同 祖先 的 现象 。 

mortality 死亡 率 。 适 合 度 的 一 个 分 量 。 某 一 给 定 基因 型 的 个 体 在 达到 某 一 年 龄 之 前 死亡 的 平均 概 

率 ( 例 如 ,到 平均 生育 年 龄 的 死亡 率 ) 。 

mosaic protein (chimeric protein ) 镶 舱 蛋 白质 ( 嵌 合 蛋白 质 ) 。 由 一 个 有 来 自 不 同 基因 的 区 域 的 基因 
编码 的 蛋白 质 。 也 指 通过 遗传 工程 而 得 到 的 人 工 蛋 白质 。 

.mRNA( 见 messenger RNA) ff ff RNA. 

multifurcation 多 ( 重 ) 分 又 。 包 括 3 个 以 上 的 分 类 学 单位 的 系统 树 中 ,等 级 不 明 的 分 枝 的 图 象 表 
示 。 偶 尔 , 也 是 同时 产生 两 个 以 上 物种 的 物种 形成 事件 的 图 象 表示 。 
~ multigene family(Cgene family) 多 基因 家 族 ( 基 因 家 族 )。 由 某 一 祖先 基因 重复 而 产生 的 一 套 基因 ， 
它们 间 的 相似 度 大 于 50% 。 它 们 相互 间 常 常 紧密 连锁 ,具有 相似 或 重 释 的 功能 。 

multiple substitution 多 重 替 换 。 在 某 一 DNA 序列 的 同一 核 苷 酸 位 点 上 相继 发 生 两 次 或 多 次 替 
换 。 

mutagen 诱 变 剂 。 使 突变 率 增加 的 物理 学 或 化 学 实体 。 

mutant 突变 型 。 某 一 些 基 因 的 一 种 新 变异 型 。 

mutation 突变 。 使 某 一 DNA 序列 变 成 不 同 于 其 原来 状态 的 改变 。 

mutation rate 突变 率 。 某 一 个 体 中 ,每 单位 时 间 里 每 核 苷 酸 位 点 或 每 基因 产生 的 突变 数 。 

mutational bias 突变 偏 斜 。 四 种 核 苷 酸 表 现 出 有 不 同 的 突变 倾向 ,或 者 产生 某 一 核 苷 酸 多 于 其 他 
核 苷 酸 这 样 结果 的 突变 模式 。 常 常 是 由 各 核 苷 酸 不 均等 地 积累 所 造成 的 。 

N (1) 在 DNA 或 RNA 中 ,表示 某 一 未 知 的 核 苷 酸 。(2) 在 蛋白 质 中 表示 天 冬 酰 胺 。 

”natural selection (selection ) 自然 选择 (选择 )。 由 于 各 个 体 或 各 基因 型 间 适 合 度 上 的 变异 性 ,造成 

某 一 物种 的 不 同 成 员 的 生殖 差异 ,从 而 导致 了 等 位 基因 频率 随 着 时 间 的 改变 而 改变 。 

negative selection 负 选 择 ( 见 purifying selection ) 

neighboring taxa 近邻 分 类 学 单位 ( 见 sister taxa). 

neutral mutation 中 性 突变 。 不 改变 该 生物 的 适合 度 的 突变 。 

neutral theory (neutral-mutation theory 或 neutral-mutation hypothesis) 中 性 学 说 (中 性 突变 学 或 中 
性 突变 假说 )。 认 为 分 子 水 平 上 的 进化 主要 是 由 突变 输入 和 随机 遗传 漂 变 所 决定 ,而 不 是 由 自然 选择 
所 决定 。 

node 节点 。 系 统 树 中 某 一 现存 的 或 祖先 的 OTU 的 图 象 表示 。 

nondegenerate site 非 简 并 位 点 。 编 码 区 中 所 有 替换 都 是 非 同 义 蔡 换 的 核 苷 酸 位 点 。 

nondisjunction 不 分 离 。 减 数 分 裂 期 间 同 源 染 色 体 的 分 离 失 败 。 

nonfunctionalization (silencing) 无 功能 化 (沉默 )。 继 丧失 功能 的 突变 之 后 ,功能 基因 变 成 假 基 因 的 
转变 。 

nongenic DNA 非 基 因 DNA。 基 因 组 中 不 含 基因 的 部 分 。 

nonsense codon 无 意义 密码 子 ( 见 termination codon) 。 

nonsense mutation 无 ( 意 ) 义 突变 。 使 有 意义 密码 子 变 成 终止 密码 子 的 突变 。 

nonsense strand 无 义 链 。 基 因 的 一 条 链 转 录 产 生 RNA, 另 一 条 不 产生 RNA 的 链 即 无 义 链 , 其 转 
录 本 的 顺序 与 RNA 的 互补 。 

nonsynonymous substitution (missense substitution ) 非 同 义 替 换 ( 误 义 替 换 )。 使 某 一 密码 子 变 成 为 
另 一 氨基 酸 编 码 的 密码 子 的 替换 。 

N-terminal N-( 末 ) 端 ( 见 amino terminal) 

nucleic acid KRM. DNA Bk RNA. 

nucleotide (base ) % #f B (HRAE) . HH — 4 A HE. — KE. A — ERE RA 2. PK 
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酸 的 基本 建筑 砖 块 。 

nucleotide diversity 核 苷 酸 多 样 度 。 用 于 测度 核酸 序列 的 多 态 性 的 尺度 。 从 某 一 群体 随机 选取 的 
任何 两 个 序列 间 的 每 位 点 平均 核 苷 酸 差异 数 。 

nucleotide substitution 核 苷 酸 蔡 换 。 发 生 了 一 个 核 苷 酸 被 另 一 核 苷 酸 蔡 换 的 一 种 突变 。 在 进化 中 
指 一 个 核 苷 酸 被 另 一 个 将 在 群体 中 固定 的 核 苷 酸 蔡 换 。 

nucleotypic 核 类 型 的 。 指 DNA 序列 的 除 作 为 遗传 信息 的 携带 者 以 外 的 某 种 功能 (例如 ,起 作为 细 
胞 核 骨 架 的 作用 )。 

nucleus( 复 数 nuclei) 细 胞 核 。 真 核 生物 中 ,一 个 由 膜 包 被 而 含有 染色 体 的 细胞 器 。 

observed heterozygosity 观察 到 的 杂 合 度 ( 见 heterozygosity ) 。 

ontogeny 个 体 发 育 、 个 体 发 生 。 生 物 从 合子 到 成 体 的 发 育 中 的 事件 序列 。 

open reading frame(CORF) 开 读 框 架 。 具 有 可 翻译 成 蛋白 质 潜力 的 DNA 序列 。 

operational taxonomic unit(OTU ) 操 作 中 的 分 类 单位 。 任 一 被 研究 的 现存 分 类 学 单位 。 

operon 操纵 子 。 一 种 遗传 学 单位 或 由 一 个 或 多 个 基因 构成 的 基因 复 , 这 些 基因 作为 一 个 单位 而 被 
转录 ,而 且 以 协调 的 方式 表达 。 

ORF (Ji open reading frame) 。 

organelle 细胞 器 。 严 格 地 说 指 真 核 生物 细胞 内 由 功能 膜 包 被 的 结构 (例如 ,细胞 核 ,线粒体 , 叶 绿 
体 )。 通 常 都 把 细胞 核 排 除 在 外 。 

orthology 垂直 相关 。 作 为 物种 形成 事件 的 结果 而 产生 的 顺序 相似 。 

OTU Cl operational taxonomic unit) 。 

outgroup 组 外 单位 。 在 一 群 物种 中 ,与 其 他 物种 亲缘 关系 最 疏远 的 一 个 或 一 组 物种 。 该 分 类 单位 
在 其 他 分 类 单位 相互 分 岐 之 前 ,已 从 这 群 分 类 单位 中 分 岐 出 来 了 。 

out-of-phase overlapping 4b} HB. [A]— DNA 序列 中 以 不 同 读 码 框架 为 两 个 或 多 个 蛋白 质 编 
码 。 

overdominance(heterosis ,heterozygote advantage,hybrid vigor) 超 显 性 (杂种 优势 、 杂 合子 优势 、 杂 
种 优势 )。 由 杂 合 子 比 两 种 纯 合 子 有 更 高 适合 度 而 产生 的 选择 形式 。 

P fi AR . 

palindromic sequence 回 文 顺 序 。 对 两 条 互补 链 读 出 相同 结果 的 DNA 或 RNA 顺序 (如 AATG- 
CATT)。 表 现 出 关于 某 一 中 心 轴 点 对 称 的 DNA 或 RNA 顺序 。 

parallel substitution 平行 替换 。 在 两 个 或 更 多 谱系 中 独立 地 发 生 位 于 同一 核 苷 酸 位 点 上 的 相同 突 
变 。 

paralogy 平行 相关 。 重 复 的 祖先 基因 的 后 代 间 的 顺序 相似 。 

pararetrovirus 拟 反 录 病 毒 。 含有 一 个 为 反 转 录 酶 编码 的 基因 ,但 自身 不 能 插 和 人 宿主 染色 体 的 病 


parsimony 节省 。 从 字面 上 解释 , 即 以 最 少 的 操作 而 达到 目的 。( 见 maximum parsimony) 

partial gene duplication( 见 internal gene duplication ) 部 分 基因 重复 。 

pattern of mutation 突变 的 模式 。 指 相对 频率 ,一 种 核 苷 酸 以 这 种 频率 突变 成 另 一 种 核 背 酸 。 

pattern of substitution Csubstitution scheme ) 替 换 的 模式 (替换 方式 )。 指 相对 频率 ,在 进化 过 程 中 
一 种 核 苷 酸 或 氨基 酸 以 该 频率 变 成 为 另 一 种 。 

PCR( 见 polymerase chain reaction ) 

phage( 见 bacteriophage ) Mit Pa TK 

phase class 相位 类 型 。 内 含 子 所 处 的 位 置 ,相对 于 两 邻近 的 为 蛋白 质 编码 的 外 显 子 的 阅读 框架 的 
类 型 。 

phase -0 intron 相位 -0 内 含 子 . 位 于 两 密码 子 之 间 的 内 含 子 。 

phase-1 intron 相位 一 1 内 含 子 。 位 于 某 一 密码 子 的 第 一 和 第 二 核 苷 酸 之 间 的 内 含 子 。 

phase—2 intron 相位 一 2 内 含 子 。 位 于 某 一 密码 子 的 第 二 和 第 三 核 苷 酸 之 间 的 内 含 子 。 
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phenogram 表 型 关系 图 。 根 据 一 些 个 体 、 物 种 、 或 更 高 级 的 分 类 单位 之 间 的 所 有 相似 性 ,以 描绘 
或 试图 描绘 它们 间 的 分 类 学 关系 的 一 种 图 形 表示 。 

phenotype 表 型 。 某 种 遗传 控制 性 状 的 可 观察 特征 。 

phylogenetic tre 系统 (发 育 ) 树 。 表 示 一 群 分 类 单位 或 一 群 基 因 的 系统 发 育 的 图 形 。 

phylogenetics 系统 发 育 学 。 重 建 一 群 分 类 单位 或 一 群 基因 的 进化 史 的 科学 。 

phylogeny 系统 发 育 。 一 群 分 类 单位 或 一 群 基因 及 其 祖先 的 进化 史 。 

plasmid 质粒 。 一 种 自治 且 自 我 复制 的 染色 体外 环 状 DNA。 

point mutation 点 突变 。 仅 涉及 一 个 核 苷 酸 位 点 的 突变 。 通 常 为 一 次 核 苷 酸 蔡 换 。 

polarity 极 性 。 核 酸 从 5 到 3 “方向 被 阅读 的 性 质 ,其 结果 与 按 相 反方 向 阅读 的 不 同 。 

polyadenylation signal 多 聚 腺 苷 酸化 信号 。 大 多 数 真 核 生 物 mRNA 分 子 上 都 有 的 一 个 区 块 ,决定 
多 聚 腺 苷 酸 位 点 的 定位 。 

polyadenylation site(poly(A)-addition site) 多 聚 腺 苷 酸化 位 点 (多 聚 (A) 添 加 位 点 )。 真 核 生物 中 
大 多 数 mRNA 分 子 的 3 端 部 位 。 在 该 位 点 处 将 被 添上 一 个 多 聚 A BE. 

polygamy 多 配偶 制 。 一 种 交配 体制 ,在 这 种 体制 中 或 者 一 个 雄性 与 一 个 以 上 的 肉 性 交配 (一 夫 多 
妻 制 妨 或 者 一 个 雌性 与 一 个 以 上 的 雄性 交配 (一 妻 多 夫 制 ) 。 

polymerase chain reaction(PCR ) 多 聚 酶 链 式 反 应 。 从 未 纯化 的 混合 物 中 选 定 DNA 序列 加 以 扩 增 
的 方法 。 

polymorphism (genetic polymorphism) 多 态 性 (遗传 多 态 性 )。 某 一 基因 座位 上 两 个 或 多 个 等 位 基 
因 共 存 的 现象 。 

polypeptide 多 肽 。 由 氨基 酸 通过 肽 键 而 相互 共 价 连接 而 成 的 分 子 。 通 常 , 它 用 来 指 某 一 蛋白 质 的 
功能 性 三 维 构 型 确定 前 的 氨基 酸 链 。 

polyphyletic 多 源 (发 生 ) 的 。 从 不 同 祖先 传 下 来 的 。 

polyploidy (genome doubling ,genome duplication ) 多 倍 体 , 多 倍 性 重复 (基因 组 加 们 ,基因组 重复 ) 。 
一 个 细胞 或 一 个 个 体 中 存在 多 于 两 个 单 倍 染色 体 组 的 现象 (例如 ,四 倍 体 . 六 倍 体 ) 。 

polyprotein 多 和 蛋白。 一 种 翻译 后 分 裂 成 两 个 或 多 个 蛋白 质 的 多 肽 。 

population 群体 。 某 一 物种 中 共有 一 个 基因 库 的 一 群 个 体 。 

population size(census population size) 群 体 大 小 (统计 群体 大 小 )。 一 个 群体 的 个 体 数 。 

positive selection 正 选 择 。 对 某 一 有 利 突变 等 位 基因 的 选择 。 

pre-messenger RNA(pre-mRNA) 前 体 信 使 RNA。 某 一 为 蛋白 质 编 码 基因 的 初级 转录 本 ,处 于 成 
熟 前 状态 。 

preproprotein 前 蛋白 原 。 处 于 任何 翻译 后 变化 发 生 之 前 的 初级 翻译 产物 。 

pretermination codon 前 终止 密码 子 。 只 需 一 次 突变 即 可 变 成 终止 密码 子 的 密码 子 。 

primary amino acid 基本 氨基 酸 。 由 普 适 遗传 密码 决定 的 20 种 氨基 酸 中 的 任何 一 种 。 

primary structure 一 级 结构 。 多 肽 链 中 氨基 酸 的 顺序 。DNA 或 RNA 分 子 中 核 背 酸 的 顺序 。 

processed gene( 见 retrogene) 加 工 后 基因 。 

processed pseudogene( 见 retropseudogene) 加 工 后 假 基 因 。 

processed sequence( 见 retrosequence) 加 工 后 序列 。 

prokaryote(bacterium) 原核 生物 (细菌 )。 一 种 缺乏 核 膜 . 与 DNA 结合 的 组 蛋白 .和 细胞 器 的 生 
物 。 包 括 真 细菌 和 十 细菌 。 

proprotein 蛋白 原 。 一 种 信号 肽 被 去 除 而 附加 的 翻译 后 修饰 还 未 进行 的 翻译 产物 。 

“prosthetic group 辅 基 。 与 脱 辅 基 蛋 白 结合 以 满足 功能 性 要 求 的 非 蛋白 分 子 (例如 血红 蛋白 中 的 血 

红 素 ) 。 

protein 蛋白 质 。 由 一 条 或 多 条 多 肽 链 组 成 的 分 子 。 可 含有 也 可 不 含有 辅 基 。 

protein-coding gene 为 蛋白 质 编码 的 基因 。 包 含 一 个 阅 渎 框架 的 基因 ,其 mRNA 将 被 翻译 成 蛋白 
质 。 
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provirus 前 病毒 。 整 合 进 宿 主 细胞 基因 组 中 的 病毒 基因 组 。 
pseudogene 假 基 因 。 在 顺序 上 与 某 一 功能 基因 同 源 、 但 无 功能 的 DNA 片段 。 某 一 基因 家 族 中 的 
非 功 能 性 成 员 。 
purifying selection (negative selection ) 纯 洁 化 选择 ( 负 选 择 )。 造 成 使 某 一 等 位 基因 从 群体 中 去 除 
这 样 的 结果 的 选择 体制 。 
purine 味 叭 。 一 类 存在 于 核 苷 酸 中 的 含 氮 碱 基 , 由 两 个 联 在 一 起 的 环 式 结 构 组 成 ,一 个 为 五 员 环 、 
另 一 个 为 六 员 环 。DNA Al RNA AY ER DE A RR A SRK, 
pyrimidine 喀 啶 。 存 在 于 核 苷 酸 中 的 一 种 含 氮 碱 基 类 型 ,由 一 个 六 员 环 组 成 。DNA 中 的 喀 啶 碱 基 
是 胞 喀 喧 和 胸腺 喀 啶 。RNA 中 的 喀 喧 碱 基 为 胞 喀 啶 和 尿 喀 啶 。 
Q FABRE. 
quaternary structure 四 级 结构 。 具 有 两 个 或 多 个 亚 基 的 和 蛋白质 分 子 中 ,两 个 或 多 个 多 肽 链 间 相互 
作用 的 类 型 和 方式 , 即 代表 了 该 蛋白 质 的 四 级 结构 。 
R HAR. 
radical substitution 激进 的 替换 。 某 一 氨基 酸 被 另 一 化 学 性 质 明 显 不 同 的 氨基 酸 所 替换 。 
random genetic drift(Cdrift,genetic drift) 随 机 遗传 漂 变 ( 漂 变 、 遗 传 漂 变 )。 因 偶然 事件 ,例如 配子 
的 取样 ,而 造成 的 等 位 基因 频率 随 世 代 的 波动 。 
rate of gene substitution 基因 替换 的 速率 。 每 单位 时 间 每 基因 座位 的 基因 替换 数 。 
rate of mutation 突变 率 。 每 单位 时 间 ( 通 常 以 每 世代 时 间 ) 每 基因 座位 或 每 核 苷 酸 位 点 的 突变 数 。 
rate of nucleotide substitution 核 苷 酸 替 换 速 率 。 每 单位 时 间 每 核 苷 酸 位 点 的 核 背 酸 蔡 换 数 。 
reading frame 阅读 框架 , 读 码 框架 。 一 个 以 起 始 密码 子 开头 以 终止 密码 子 结束 的 为 蛋白 质 编码 基 
因 中 ,密码 子 的 直线 顺序 。 
recessiveness 隐 性 。 杂 合子 中 某 一 等 位 基因 不 表现 出 来 的 现象 。 
recognition sequence 识别 顺序 。 被 某 一 限制 性 内 切 核 酸 酶 识别 的 顺序 。 在 很 多 情况 下 是 一 个 短 的 
回 文 顺序 。 
recombination 重组 。 染 色 体 交叉 后 产生 的 结果 ,可 看 到 顺 反 子 中 等 位 基因 的 新 组 合 。 
recombinator gene 重组 子 基 因 。 一 种 给 重组 酶 提供 识别 位 点 的 调节 基因 。 
reduction division( 见 meiosis) 减 数 分 裂 。 
regional duplication 区 域 性 重复 。 重 复 量 小 于 全 基因 组 的 重复 都 称 区 域 性 重复 。 
regulatory gene 调节 基因 。 一 种 非 转录 基因 。 有 时 用 来 指 调节 其 他 基因 的 表达 的 结构 基因 。 
relative - rate test 相对 速率 测验 。 一 种 无 需 标 度 的 测验 。 以 检验 不 同 谱系 在 其 进化 过 程 中 核 苷 酸 
替换 速率 的 恒定 性 ,从 而 确定 分 子 钟 在 不 同 谱系 中 是 否 以 同样 的 速率 运转 。 
repetitive DNA 重复 DNA。 以 许多 拷贝 存在 于 单 倍 基因 组 中 的 DNA 序列 。 
replacement 替代 、 取 代 。 在 蛋白 质 水 平 上 一 次 非 同 义 替 换 所 造成 的 结果 。 
replication 复制 。DNA 在 某 一 DNA 模板 上 合成 的 过 程 。 
replication slippage 复制 滑脱 。DNA 复制 期 间 , 某 一 DNA 序列 作为 模板 不 止 一 次 地 连续 起 作用 ， 
从 而 在 新 合成 的 DNA 上 产生 了 一 段 串 接 重复 的 序列 ,这 样 的 过 程 称 复制 滑脱 。 
replicative transposition (duplicative transposition ) 复制 (型 ) 转 座 。 可 转 座 因子 的 一 个 拷贝 插 人 新 的 
染色 体位 置 ,而 该 因子 自身 仍 留 在 原初 位 置 的 现象 。 
replicator gene 复制 子 基 因 。 一 种 指定 DNA 复制 的 起 始 和 终止 位 点 的 调节 基因 。 
replicon 复制 子 。 一 个 染色 体 区 域 , 它 含 有 为 DNA 复制 所 必需 的 DNA 序列 ,并 且 它 作为 一 个 单 
位 而 被 复制 。 
reproductive barrier(reproductive isolation) 生 殖 障 碍 (生殖 隔离 )。 阻 止 群体 间 基 因 交 换 的 几 种 生 
物 学 的 、 或 环境 的 机 制 中 的 任何 一 种 。 
restriction endonuclease(restriction enzyme) 限 制 性 内 切 核 酸 酶 (限制 酶 )。 水 解 DNA 的 内 部 磷酸 
二 酯 键 的 酶 。 
© 154° 
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restriction-fragment pattern 限制 片段 模式 。 某 一 DNA 序列 被 限制 性 内 切 核酸 酶 消化 后 , 它 所 产 
生 的 限制 片段 的 数目 和 大 小 的 情况 。 

restriction site 限制 位 点 。 限 制 性 内 切 核酸 酶 水 解 (切割 )DNA 的 某 一 内 部 磷酸 二 酯 键 时 的 作用 
点 。 位 置 可 能 非常 接近 识别 序列 ,也 可 能 不 接近 识别 位 点 。 
VV restriction-site map 限制 位 点 图 谱 。 显 示 限 制 位 点 所 处 位 置 的 DNA 序列 的 图 形 。 

retroelement 反 录 因子 。 具 有 产生 反 转 录 酶 能 力 的 DNA 或 RNA 序列 。 

retrofection 反 录 感染 (传染 )。RNA 分 子 通过 反 录 病毒 粒子 (RNA 被 包 在 里 面 ) 而 从 一 个 细胞 向 
另 一 个 细胞 (特别 是 种 系 细胞 ) 转 移 , 然 后 RNA 被 反 转 录 并 整合 进 宿 主 细胞 ,这 样 的 过 程 称 反 杂 感 
染 。 即 通过 反 录 病毒 而 转 导 。 

retrogene (processed gene) 反 录 基 因 ( 加 工 后 基因 )。 一 种 有 功能 的 反 录 序列 , 它 产 生 的 蛋白 质 与 
mRNA 原来 的 基因 所 产生 的 蛋白 质 等 同 或 接近 等 同 。 

retron 反 录 子 。 一 种 有 反 转 录 酶 密码 信息 但 缺乏 转 座 能 力 的 基因 组 序列 。 

retroposition 反 录 转 座 。 一 种 由 RNA 中 介 的 转 座 模式 。 

retroposon 反 录 座 子 ,又 译 “ 反 转录 子 ”。 一 种 既 不 构成 病毒 子粒 子 , 又 无 两 侧 末 端 完 余 序列 的 可 
转 座 反 录 因子 。 

retropseudogene (processed pseudogene) 反 录 假 基因 (加 工 后 假 基 因 )。 一 种 由 RNA 分 子 反 转录 而 
来 ,其 后 的 cDNA 整合 进 基因 组 而 出 现 的 假 基因 。 判 定 反 录 假 基 因 的 标志 有 :缺乏 内 含 子 .多 聚 腺 苷 
酸 尾 巴 ,两 侧重 复 ; 表 现 出 截 尾 等 转录 后 修饰 迹象 ;以 及 与 该 基因 家 族 的 有 功能 成 员 或 非 加 工 后 的 无 
功能 成 员 都 无 连锁 关系 (无 位 置 上 的 关联 )。 

retrosequence(retrotranscript, processed sequence) 反 录 序 列 ( 反 录 本 ,加 工 后 序列 ) 一 种 由 RNA 
反 转 录 而 来 的 基因 组 序列 ,但 仅 靠 它 自身 则 缺乏 产生 反 转 录 酶 的 能 力 。 反 录 基 因 和 反 录 假 基 因 都 是 反 
录 序 列 。 

retrotransposon 反 录 转 座 子 。 一 种 不 构成 病毒 子粒 子 而 两 侧 有 末端 宛 余 序列 的 可 转 座 反 录 因 子 。 

retrovirus 反 录 病毒 。 一 类 有 反 转 录 酶 密码 信息 的 小 单 链 RNA 病毒 。 

reverse transcriptase 反 转 录 酶 。 催 化 逆向 转录 的 酶 。 

reverse transcription 反 转 录 。 以 RNA 为 模板 而 进行 的 单 链 DNA 分 子 的 合成 。 

ribonucleic acidCRNA) 核 糖 核酸 。 由 核 苷 酸 连接 而 成 的 大 分 子 多 聚 物 ,其 中 糖 基 为 核糖 。 通 常 ， 
RNA 呈 单 链 。 

ribosomal RNACRNA) 核 糖 体 RNA。 作 为 核糖 体 中 的 结构 成 份 的 RNA 分 子 。 

ribosome 核糖 体 。 由 rRNA 和 和 蛋白质 组 成 的 一 种 细胞 内 颗粒 ,为 mRNA 的 翻译 提供 场所 。 

RNA( 见 ribonucleic acid) 

RNA-specifying gene 编码 RNA 的 基因 。 可 转录 但 产生 的 RNA 不 被 翻译 的 基因 。 其 RNA 转录 
本 是 有 功能 者 的 基因 。 

rollimg-circle replication 滚 环 复制 。 一 种 扩 增 模式 , 按 此 模式 某 一 DNA 序列 的 环 状 染色 体外 拷贝 
产生 、 并 以 连续 方式 复制 。 
\ | root 根 。 在 有 根 树 中 ,所 有 被 研究 的 分 类 单位 的 共同 祖先 。 

”root tree 有 根 树 。 一 种 指明 祖先 和 后 代 物 种 ,从 而 指出 了 进化 途径 的 方向 的 系统 树 。 

ITRNA( 见 ribosomal RNA) 

S 丝氨酸 。 

secondary structure 二 级 结构 。 在 蛋白 质 和 核酸 中 ,分 别 由 氨基 酸 之 间或 核 苷 酸 之 间 形 成 氢 键 而 
导致 的 结构 。 对 蛋白 质 而 言 , 是 多 肽 链 中 的 区 域 性 结构 (例如 一 螺旋 、B 一 片 状 、 转 折 )。 对 单 链 DNA 
或 RNA 来 说 , 则 为 区 域 性 双 链 结构 (例如 发 卡 )。 

segregation( 见 Mendelian segregation) 分离 。 

segregation distortion(meiotic drive) 分 离 偏 斜 ( 减 数 分 裂 驱 动 )。 在 杂 合 子 的 配子 间 出 现 的 分 离 比 
偏离 。 
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seqregator gene 分 离子 基因 。 一 种 在 减 数 分 裂 和 有 丝 分 裂 期 间 为 分 离 机 构 提供 染色 体 附 着 部 位 
的 调节 基因 。 

selection( 见 natural selection) 选择 。 

selection coefficient 选择 系数 。 某 种 基因 型 与 群体 中 最 适 基 因 型 相 比 , 其 适合 度 降 低 的 定量 测度 。 
一 种 对 选择 不 利 性 的 测度 。 

selection intensity (stringency of selection ) 选 择 强度 (选择 的 严峻 程度 )。 和 群体 中 各 种 基因 型 间 适 合 
度 值 上 的 差异 。 

selective constraint( 见 functional constraint) 选 择 限 制 。 

selfish DNA 自私 DNA。 一 种 对 其 携带 者 (或 宿主 ) 可 能 无 任何 好 处 ,而 仅 关 心 其 自身 传播 的 
DNA 片段 。 可 转 座 因子 被 认为 是 自私 DNA。 

self-splicing intron 自 ( 我 ) 拼 接 内 含 子 。 一 种 无 需 外 来 催化 剂 帮助 而 能 从 前 mRNA 中 分 裂 出 来 的 
内 含 子 。 

sense codon 有 义 密 码 子 。 确 定 某 种 氨基 酸 的 密码 子 。 

sense strand 有 义 链 。 基 因 的 非 转录 链 , 该 链 的 DNA 顺序 与 RNA 转录 本 的 等 同 。 

sequence divergence(divergence) 序 列 分 岐 ( 分 岐 )。 两 同 源 序列 由 于 各 自在 其 谱系 中 独立 地 积累 遗 
传 变化 ,而 出 现 的 相互 间 的 差异 。 

sex-linkage 性 连锁 。 位 于 性 染色 体 上 的 基因 所 处 的 处 境 。 该 术语 常 限于 指 x 一 染色 体 上 的 基因 。 

sibling species 姐妹 种 ,同胞 种 。 形 态 上 不 可 区 分 但 生殖 上 出 现 隔离 的 物种 。 

signal peptide 信和 号 肽 。 在 多 肽 合成 后 且 在 该 蛋白 质 确定 其 正确 的 三 级 结构 之 前 ,而 从 多 肽 中 分 裂 
出 来 的 领头 肽 。 

silencing( 见 nonfunctionalization ) 沉 默 ( 化 )。 

silent substitution 沉默 替换 。 不 改变 其 携带 者 的 表 型 的 替换 。 包 括 非 基因 DNA 中 的 替换 和 同 义 
替换 。 

simple transposon 简单 转 座 子 。 不 含 插 入 序列 的 转 座 子 。 

SINE(Short Interspersed Element 的 首 字 母 缩 略 ) 短 散在 因子 。 多 细胞 真 核 生物 的 基因 组 中 ,长 度 
短 于 500 碱 基 对 、 拷 贝 数 为 10: 或 更 多 的 散在 重复 序列 ,都 可 称 为 SINE( 短 散在 因子 )。 

single-copy DNA( 见 unique DNA) 单 拷贝 DNA, 

sister taxa(neighboring taxa) 姐 妹 分 类 单位 (近邻 分 类 单位 )。 一 般 用 来 指 一 群 物种 中 相互 在 进化 
程度 上 最 接近 的 物种 对 。 在 系统 树 中 , 即 两 个 仅 通 过 一 个 内 部 节点 联系 起 来 的 分 类 单位 。 

somatic cell 体 细 胞 。 注 定 不 会 变 成 配子 的 细胞 。 

somatic mutation 体 细 胞 突变 。 体 细胞 中 发 生 的 突变 。 

spacer DNA 间隔 DNA。 处 于 两 个 基因 之 间 的 DNA。 可 以 被 转录 也 可 以 不 被 转录 。 

speciation (cladogenesis) 物 种 形成 (分 枝 进化 ) 。 一 个 群体 分 裂 成 两 个 或 多 个 生殖 隔离 的 群体 的 过 
程 。 新 物种 通过 此 过 程 产生 。 

species 物种 .分 类 中 的 一 个 基本 范畴 ,对 此 有 一 些 不 同 的 定义 :(1) 一 群 真实 的 或 潜在 的 可 相互 杂 
交 的 个 体 , 它 们 与 别 的 这 样 的 类 群生 殖 隔 离 ( 生 物 学 物种 概念 );(2) 一 个 与 别 的 谱系 在 进化 上 分 离 的 
谱系 (进化 论 物 种 概念 ); (3) 一 群 彼此 相似 的 生物 ,它们 间 的 相似 远 胜 于 与 群 外 生物 的 相似 (分 类 学 物 
种 概念 ) 。 

species tree 物种 树 。 表 示 一 群 物种 间 的 进化 关系 的 系统 树 。 

splicing 拼接 。 在 RNA 走向 成 熟 的 加 工 中 ,去 除 内 含 子 的 过 程 。 

splicing site or junction 拼接 位 点 或 拼接 点 。 外 显 子 和 内 例子 间 的 界 点 。 

split gene 断裂 基因 。 含 有 内 含 子 的 基因 。 

standard nucleotide 标准 核 苷 酸 。 即 腺 味 叭 核 苷 酸 (A)、 胞 喀 啶 核 苷 酸 (C)、 乌 味 叭 核 苷 酸 (G)、 胸 
Fie Wa Wie AK EF RCT), BK, ae ME FF PR CU). 

sticky ends 粘性 未 端 。 从 双 螺 旋 DNA 相对 的 两 端 伸 出 的 DNA 单 链 。 通 常 是 双 链 DNA 被 某 种 
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限制 酶 错开 式 地 切割 而 产生 的 。 

stochastic process 随机 过 程 . 结 果 不 能 从 初始 条 件 知识 而 精确 地 预测 到 的 过 程 即 随机 过 程 。. 不 过 ， 
根据 给 定 的 初始 条 件 ,对 该 过 程 的 每 一 可 能 出 现 的 结果 可 得 出 一 定 的 概率 。 

stop( 见 termination codon) 终 止 ,休止 符 。 

stringency of selection( 见 selection intensity) 选 择 的 严峻 程度 。 

strong bond 强 键 。 与 双 键 的 核酸 或 片段 (例如 密码 子 一 反 密 码 子 相互 作用 ) 有 关 的 、 存 在 于 C 和 
G 间 的 三 个 氢 键 。 强 键 能 增加 稳定 性 ,提高 熔 解 温度 。 

structural domain( 见 module) 结 构 域 。 

structural gene 结构 基因 。 一 段 为 蛋白 质 编码 或 确定 一 种 RNA 分 子 的 DNA 序列 。 另 一 些 作 者 则 
仅 把 为 蛋白 质 编 码 的 基因 当 作 结构 基因 。 

subspecies 亚 种 。 某 一 物种 中 的 一 个 地 理学 上 或 形态 学 上 有 区 别 的 群体 。 

substitution (i, gene substitution 和 nucleotide substitution) 替换 。 

substitution matrix 替换 矩阵 。 以 矩阵 的 形式 表示 的 替换 模式 ,其 中 的 元 则 表示 某 两 个 核 苷 酸 间 
的 相对 替换 速率 。 

substitution scheme( 见 pattern of substitution ) 蔡 换 方 式 。 

superfamily 超 家 族 。. 相 互 间 有 一 定 程度 分 岐 的 一 些 基 因 的 集合 ,把 基因 重复 的 一 切 产物 都 包括 在 
内 〈 对 为 蛋白 质 编码 的 基因 来 说 ,通常 氨基 酸 水 平 上 的 相似 性 小 于 50%% )。 

symbiosis 共生 。 两 个 或 多 个 生物 以 互利 关系 共存 。 

symmetrical exon 对 称 外 显 子 。 位 于 两 个 同 相 位 内 含 子 之 间 的 外 显 子 。 

synonymous substitution (silent substitution ) 同 义 替 换 ( 沉 默 替 换 )。 核 苷 酸 蔡 换 后 的 密码 子 确定 的 
氨基 酸 与 以 前 的 相同 ,这样 的 蔡 换 称 同 义 蔡 换 。 

systematics 系统 学 。 即 分 类 学 和 系统 发 育 学 

T(1) 在 DNA PRA wR MER. DEBRA RA HAR. 

tandem duplication 串 接 重复 。 重 复 产 物 位 于 染色 体 上 相互 紧 挨 在 一 起 处 的 重复 形式 。 

taxon( 复 数 taxa) 分 类 单位 、 分 类 群 。 指 任何 等 级 的 分 类 学 群 ( 例 如 种 、 属 ` 界 )， sa ial 28 
标准 而 被 归于 各 和 群 之 中 。 

taxonomy (classification ) 分 类 学 (分 类 )。 指 将 物种 命名 并 归于 分 类 学 群 中 的 原则 和 程序 。 

terminal node 末端 节点 。 系统 树 中 表示 一 个 现存 分 类 单位 的 图 形 。 

termination codon (nonsense codon ,stop) 终 止 密码 子 (无 意义 密码 子 、 休止 符 ) 。 一 种 不 存在 与 其 对 
应 的 正常 tRNA 的 密码 子 , 其 出 现 可 终止 翻译 过 程 。 普 适 遗 传 密码 中 的 三 个 终止 密码 子 为 UAG、 
UAA 和 UGA。 

tertiary structure 三 级 结构 。 在 蛋白 质 和 核酸 中 ,由 其 自身 的 折 和 大 而 导致 的 分 子 的 三 维 结构 即 三 
级 结构 。 

thermal stability 热 稳 定性 。 表 示 抗 变性 或 抗 熔 解 程度 的 一 种 性 质 。 

Tm 双 螺 旋 DNA 熔 解 时 的 中 间 温 度 。 

AT 同 源 双 螺旋 DNA 与 异 源 双 螺旋 DNA 的 中 间 熔 解 温度 之 间 的 差 。 

topology 拓扑 学 .拓扑 图 。 系 统 树 的 分 梳 模 式 。 

trans 反 式 。 两 个 序列 或 基因 排列 在 不 同 染色体 上 。 

transcription 转录 。 在 DNA 模板 上 合成 RNA 分 子 。 

transcription-initiation site( 见 cap site) 转 录 起 始 部 位 。 

transcription-termination site 转录 终止 部 位 。RNA 转录 终止 所 在 的 位 点 。 与 被 多 聚 腺 苷 化 了 的 
RNA 对 照 ,该 部 位 可 能 与 多 聚 腺 苷 酸 部 位 等 同 , 也 可 能 不 同 。 

transduction 转 导 。 宿 主 的 遗传 信息 通过 病毒 从 一 个 细胞 癌 另 一 个 细胞 的 转移 。 

transfer RNACtRNA) 转 移 RNA。 一 种 小 分 子 核酸 , 带 有 一 个 反 密 码 子 ,一 个 与 特异 氨基 酸 结 侣 
的 位 点 ,以 及 与 核糖 体 和 酶 相互 作用 的 识别 位 点 。 这 里 的 酶 起 着 将 tRNA 与 特异 氨基 酸 连 结 的 作用 。 
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transition 转换 。 哇 叭 被 味 叭 或 喀 啶 被 喀 啶 替换 。 
translation (decoding) 翻 译 、 转 译 ( 解 码 )。 经 tRNA 中 介 而 从 mRNA 分 子 的 核 苷 酸 顺 序 得 到 多 肽 
的 氨基 酸 顺 序 的 过 程 , 此 过 程 是 在 与 核糖 体 结 合 中 发 生 的 。 
transposable element (mobile element) 可 转 座 因 子 ( 可 移动 因子 )。 一 种 能 在 某 种 生物 的 基因 组 中 
到 处 移动 的 序列 。 
transposition 转 座 。 遗 传 物质 从 一 个 基因 组 位 置 向 另 一 个 位 置 的 移动 。 
transposon 转 座 子 。 除 了 携带 与 转 座 功能 有 关 的 基因 外 还 带 有 附加 基因 的 可 转 座 因 子 。 
transversion 颠 换 。 味 叭 被 喀 啶 替换 ,或 相反 情形 的 替换 。 
trisomy 三 体 。 在 别 的 染色 体 为 两 倍 体 的 细胞 中 , 某 一 染色 体 存 在 三 个 拷贝 的 现象 。 
tRNA CK transfer RNA). 
true tree 真实 树 。 代 表 了 一 群 分 类 单位 的 真实 进化 史 的 系统 树 。 
twofold degenerate site 二 重 简 并 位 点 。 编 码 区 中 的 某 一 核 苷 酸 位 点 , 若 三 种 可 能 的 核 背 酸 改 变 中 
有 一 种 是 同 义 的 ,而 另 两 种 是 非 同 义 的 , 则 该 位 点 即 为 二 重 简 并 位 点 。 
U 尿 喀 喧 核 背 。 
unequal codon usage(biased codon usage) 密 码 子 的 不 等 价 应 用 (偏向 性 密码 子 应 用 )。 在 为 蛋白 质 
编码 的 基因 里 , 某 一 密码 子 ( 家 ) 族 中 的 一 个 或 多 个 密码 子 被 不 成 比例 地 应 用 。 
unequal crossing-over 不 等 价 交换 。 两 同 源 序列 在 不 同 染色 体 位 置 处 交换 ,新 产生 的 染色 体 出 现 
某 些 区 域 的 拷贝 数 不 相 同 的 现象 。 | 
unidentified reading frameCURF) 未 定 阅 读 框 架 。 一 种 其 产物 未 知 的 ORF. 
unique DNA (single-copy DNA) 单 一 DNA( 单 拷贝 DNA). 在 单 倍 基因 组 中 仅 以 一 个 拷贝 存在 的 
DNA 序列 。 
universal genetic code 普 适 (通用 ) 遗 传 密码 。 左 右 绝 大 多 数 基因 组 的 翻译 的 遗传 密码 。 
unprocessed pseudogene 未 加 工 的 假 基 因 。 通 过 基因 重复 得 到 ,而 随后 其 中 一 个 拷贝 无 功能 化 或 
沉默 化 ,这 样 产生 的 假 基 因 即 未 加 工 的 假 基 因 。 
unrooted tree 无 根 树 。 一 种 既 未 确定 根 , 也 未 指出 进化 途径 的 方向 的 进化 树 。 
untranscribed sequence( 见 flanking sequence) 不 转录 序列 。 
upstream 上 游 。 核 酸 上 某 一 参考 点 的 5 方向 (与 转录 方向 相反 )。 
URE( 见 unidentified reading frame) 。 
V RAR. 
variable site or region 可 变 位 点 或 可 变 区 域 。(1) 在 被 比较 的 DNA 序列 中 ,由 不 同 核 苷 酸 占据 的 
位 点 或 区 域 。(2) 严 格 地 说 , 指 DNA 中 能 随时 间 而 变 的 位 点 或 区 域 。 
variant repetition 变异 的 重复 。 自 重复 事件 发 生 以 来 ,基因 重复 的 产物 相互 分 岐 ,而 出 现 略 有 差异 
的 重复 。 
viability 生活 力 。 一 种 适合 度 成 份 。 某 一 给 定 基因 型 的 个 体 从 妊娠 活 至 生殖 年 龄 的 概率 。 
virion 病毒 子 。 一 种 病毒 颗粒 。 
virus 病毒 。 一 种 微小 的 寄生 生物 ,依赖 宿主 细胞 复制 其 遗传 物质 和 合成 其 蛋白 质 。 其 基因 组 可 能 
是 RNA 也 可 能 是 DNA, 可 以 是 单 链 的 也 可 以 是 双 链 的 。 
W AR. 
weak bond 弱 键 .与 双 链 核酸 (例如 密码 子 一 反 密 码 子 相互 作用 ) 有 关 的 存在 于 A MT RA MU 
之 间 的 二 个 氢 键 。 弱 键 使 热 稳定 性 和 熔 解 温度 降低 。 
wild type 野生 型 。 群 体 中 某 一 基因 座位 上 最 常见 的 等 位 基因 ,只 要 这 样 的 等 位 基因 存在 。 
wobble pairing 摇摆 配对 。 某 些 tRNA 通过 反 密 码 子 第 一 位 与 密码 子 第 三 位 之 间 的 非 标准 配对 
(例如 , 反 密 码 子 中 的 U 与 密码 子 中 的 G 配 对 ), 而 能 识别 一 个 以 上 的 密码 子 , 这 样 的 配对 称 摇摆 配 
at). 
x-linkage( I, sex-linkage)x 一 连锁 。 
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xenology 宿主 学 。 作 为 某 一 水 平 基因 转移 事件 的 后 果 的 序列 相似 性 。 
Y BAR. 
zygote 合子 。 由 单 倍 体 配 子 细胞 核 融 合 产生 的 两 倍 体 细 胞 。 


4 下 


+ 题 


A 
#4 EB (amino acids) , 另 见 蛋白 质 中 的 条 目 。 
缩写 (abbreviations)10 
遗传 信息 翻译 (translation of genetic information into) 
9-11 
氨基 酸 顺 序 (amino acid sequences) 
线性 排比 (Calignment)34-37 
乳牛 与 叶 猴 溶菌 酶 中 的 (in cow and langur lysozymes) 
47-48 
氨基 酸 蔡 代 (amino acid replacements)25， 另 见 非 同 义 蔡 
换 
AK Al WA 4 36 (Australian marsupials) , 分 子 古 生物 学 
Hie 


B 
& % & Z (paromomycin)77 
AA (albumin), Rime A 
白细胞 中 介 素 1 2EA interleukin | gene)43-44 
白血病 (leukemia) , ## 110 
半 加 工 反 录 基因 (semiprocessed retrogene)111 
Hid HE WE (cytosine) 6,7 
保守 (型 ) 转 座 (conservative transposition) 105-107 
倍 性 基因 (doublesex (Csz) gene)97-98 
被 子 植物 (angiosperms) ,C 值 125 
编码 区 (coding regions) ,42-44 另 见 为 蛋白 质 编 码 基 因 
变通 的 拼接 (alternative splicing)97-98 
变形 距离 法 (transformed distance method)， 用 于 系统 树 
构建 的 65-66,68,81 
变异 的 重复 (variant repeats)87 
表皮 生长 因子 (epidermal growth factor,EGF)94 
表 型 关系 图 (phenogram)68 
表 型 学 (phenetics), 与 进化 枝 学 对 应 68-69 
保护 生物 学 (conservation biology)77-81 
丙酮 酸 激 酶 (pyruvate kinase), 同 功 酶 88 
并 发 进化 (coincidental evolution)99 , 另 见 协同 进化 
病毒 基因 (virogenes)120 
从 独 独 向 猫 的 水 平 转移 (horizontal transfer from ba- 

boons to cats)120-121 
病毒 子 Cvirion)108-109 
哺乳 动物 的 C 值 Cmammalian C values)125 
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哺乳 动物 线粒体 的 遗传 密码 (mammalian mitochondria ge- os, 
netic code) 10-11,34 
哺乳 动物 线粒体 基因 组 (mammalian mitochondria 
genome )52-53, 87-88 
AR AE BE ZF (invariant repeats) 87,88 
不 等 价 交换 (Cunequal crossing-over) 12-13,127 
协同 进化 与 (concerted evolution and)92, 99-103 
基因 组 大 小 与 (genome size and)88 
低 密 度 脂 蛋白 受 体 基 因 (low-density-lipoprotein recep- 
tor gene)116 
不 翻译 区 (untranslated region)7 
中 的 核 苷 酸 蔡 换 速 率 (rates of nucleotide substitutions 
in)28,30-31 42 ¢ 
不 加 权 算 术 平 均 组 对 法 (unweighted pair group method 
with arithmetic mean ,UPGMA)64-65,68-69,72-74， 
78-81 
不 完全 变态 昆虫 (hemimetabola)82 
不 转录 间隔 (nontranscribed spacer,NTS) 99 


« 


让 
+ 
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C 
操纵 基因 (operator)8 
操纵 子 (operon )8-9 
操作 中 的 分 类 单位 (operational taxonomic units,OTUs) 另 
见 系 统 树 
复合 的 (composite)111 
侧 ( 区 ) 序 列 (flanking sequences) 
为 蛋白 质 编码 基因 与 (protein-coding genes and)7-8, 25 
中 的 核 苷 酸 替 换 速 率 (rates of nucleotide substitution 
in)45,50-51 
ff A (insertions) 11-14,34,116 
4 A FF I (insertion sequences) 107,124 
IS1 106,107 
1S4 105 
tk FF ez BL Chylobatidae) 73 
长 度 缩短 Clength abridgment) 115 
长 未 端 重复 (long terminal repeats, LTRs)109,116.128 
长 期 有 效 群 体 大 小 (long-term effective population size)22 
长 散在 的 重复 序列 (long interspersed repeated sequences) , 
同 LINEs128-129 
超 家 族 (superfamily)88, 另 见 基因 家 族 
珠 蛋 白 Cglobin)92 


i 


超 显 性 (overdominance )17,18-19,45 
沉默 (化 )(silencing)55 另 见 无 功能 化 
沉默 替换 (silent substitution )11 
成 熟 酶 (maturase)97 
i @ HH (overlapping genes)96-97 
if & (duplication) 
的 类 型 的 (types of )83 
重复 基因 (duplicate genes) 另 见 基因 重复 
无 功能 化 (nonfunctionalization )89-91 
重复 型 转 座 (duplicative transposition)105-106 另 见 复制 
型 转 座 
重组 (recombination)16,100,117 
重组 酶 (recombination enzyme)9 
重组 子 基因 (recombinator gene)9 
初 龙 亚 网 (archosauria)72 
垂直 进化 (vertical evolution) ,与 水 平 进 化 对 应 99 
垂直 相关 (orthology)90 
纯 合 子 (homozygotes) 
共 显 性 与 (codominance and)18 
纯洁 化 选择 Cpurifying selection)17,45, 47-48, 52 HRA 
害 突变 
醇 脱 氢 酶 基因 座位 (alcohol dehydrogenase (Adh) gene) 
核 苷 酸 多 样 度 Cnucleotide diversity)25-26 
KRY BF CGnosine) , XH ALF 56 
促 红 细胞 生成 素 基 因 (erythropoietin gene) 43 
促 黄体 生成 激素 基因 (luteinizing hormone gene)43 
促 甲 状 腺 激素 基因 (thyrotropin gene)43 
促进 子 (promotors)7，9，79，115 
促进 子 区 (promotor region)7 


D 
达尔 文 ,查尔斯 (Darwin ,Charles)72-73 
达尔 文 主义 (Darwinism)26 
大 鼠 (rats), 核 苷 酸 蔡 换 速 率 50 
大 猩猩 亚 科 (gorillinae)73 
单 倍 体 (haploid)16,17 
单 拷贝 DNA(Csingle-copy DNA)798-99,126-127 
单一 DNA(Cunique DNA)126-127,129 
单子 叶 植 物 (monocotyledons)53-54,129 
AB [Al 8 (cholesterol) 116 
蛋白 酶 抑制 因子 (protease inhibitors) 
内 部 域 重复 86-87 
蛋白 质 (protein(s)) 
基因 家 族 (gene families)87-89 
球状 的 (globular)84-85 
中 的 内 部 域 重 复 (internal domain duplications in)85-87 
由 内 含 子 编码 的 (intorn-encoded)97-98 
#E ik AY (mosaic) 93-94 
& A Jit C(protein c)93 


蛋白 质 域 (protein domain) ) , 见 域 
倒 位 (inversions)11-12,116 
等 位 基因 (allele(s))16,25 
共 显 性 的 (codominant)18-19 
有 害 的 (deletious)11-14,34-35,52,114,116 
的 固定 (fixation of)20-21,22-25,28 
的 丢失 (loss of)20-21 
中 性 的 Cneutral)22-23, 另 见 中 性 突变 
野生 型 (wild type)22 
等 位 基因 频率 (allele frequencies)16,17-19 
fy Yk Bh (fluctuations in)18-20 
2% 5 (polymorphism and) 24-26 
低 密 度 脂 蛋白 受 体 基因 (low-density-lipoprotein receptor 
gene) ,不 等 价 交 换 116 
低 水 平 表达 的 基因 (lowly expressed genes)56-57 
颠 换 (transversions)11-12,30-32,33-34 
点 突变 (point mutations)11 
模式 (pattern)53,55 
点 阵 法 (dot matrix method) ,顺序 线性 排列 中 的 35,36,41 
电泳 型 等 位 基因 (electrophoretic alleles)25-26 
定向 选择 (directional selection )18 
豆 血 红 和 蛋白 (leghemoglobin) ,内 含 子 84-85 
端 粒 (telomere)125-126 
短 散 在 重复 序列 (short interspersed repeated sequences) , 
同 SINEs128-129 
断裂 基因 (split genes)83 
多 倍 体 (polyploidy)83,129 另 见 基 因 组 重复 
多 次 “ 击 中 ”(multiple“hits”)31-32 
多 基因 家 族 Cmultigene families)88, 另 见 基 因 家 族 
协同 进化 (concerted evolution)98-103, 另 见 协同 进化 
多 聚 酶 链 式 反 应 (polymerase chain reaction, PCR)78-80 
多 聚 (A) 添 加 部 位 (poly(A)-addition site)6-7 
多 聚 腺 苷 化 信号 (polyadenylation signal)7-8,90 
多 拷贝 单 链 DNA(Cmulticopy singlestranded DNA, ms 
DNA)109-110 
多 配偶 制 物种 (polygamous species) ,的 有 效 群 体 大 小 21 
多 态 ( 性 .现象 )(polymorphism)20-21,24-26 
基因 转变 与 (gene conversion and)127 
新 达尔 文 主义 与 (neo-Darwinism and)26 
中 性 学 说 与 (neutral theory and)26-27 


E 

二 重 简 并 核 苷 酸 位 点 (twofold degenerate nucleotide sites) 
34-35 ,44-45 

二 氧 叶酸 还 原 酶 基因 (dihydrofolate reductase gene)113 

二 色 性 (dichromatism7)89-90 

— I st eh KM (binomial probability function )19-20 
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F 
翻译 (translation)7 ,9-10,77 
翻译 效率 (translational efficiency) , 
密码 子 应 用 模式 与 55-57 
反 录 病毒 (retroviruses)107-110,115-116 
反 录 病毒 的 序列 (retroviral sequences) ,内 源 的 120 
反 录 感 ( 传 ) 染 (retrofection)111 
反 录 基因 (retrogenes)111-112,122 另 见 反 录 序 列 
半 加 工 的 (semiprocessed)111 
反 录 假 基因 (retropseudogene)111,112-116 
另 见 反 录 序 列 
进化 (Cevolution)115-116 : 
反 录 序列 (retrosequences) 108-109, 110-111, 121-122, 128- 
129, 另 见 反 录 基 因 , 反 录 假 基因 
判定 特征 (diagnostic features)111 
类 型 (types)111 
反 录 因子 (retroelements)107-110,121-122 
分 类 (classification ) 108-109 
可 能 的 进化 途径 
110 
反 录 转 座 (retroposition)103,105-107,107-108,129 
对 宿主 基因 组 的 影响 (effects on host genome)115-116 
反 录 转 座 子 (retrotransposons)107,108-110,129 
copia 108-109 
DIRS-108-109 
JZ F (retrons) 108-110 
JQ 3% HE F (retroposons) 108-110,128-129 
cin 4 AF (cin 4 factor)128 
D 因子 (CD factor)128 
F 因子 CE factor)128 
G 因子 (G factor)128 
G3A 108-109 
I AF C1 factor) 128 
Ingil28 
L1 128-129 
的 假 基 因 (pseudogenes of )128 
R2 因子 (R2 factor)128 
反 密 码 子 (anticodon)56-57 
反 转 录 示 (retrotranseiipts) 见 反 录 序列 
反 转 录 酶 (reverse transcriptase)108-109,111,128 
放 线 菌 酮 (cycloheximide), 即 (成 二 酰 ) 亚 胺 环 已 酮 77-79 
“ 非 病 毒 的 反 录 座 子 ”(“nonviral retroposons2”) 见 反 录 序列 
非 肌 的 原 肌 球 和 蛋白 基因 (Cnonmuscle tropomyosin gene)113 
非 基 因 DNA (nongenic DNA)129 
C (A t#ié 455 (c-value paradox and)125-127 
的 维持 Cmaintenance of )131 
4E fai FF AK FB 7A (nondegenerate nucleotide sites)34-35， 
44-46 
4£ [a] 2  #& (nonsynonymoussubstitution)11-13,91 另 见 核 
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(possible evolutionary pathway ) 109- 


苷 酸 蔡 换 
速率 (rates)42-45,52-54 
选择 强度 与 (selection intensity and)45-47 
与 同 义 蔡 换 对 应 
46 
两 为 蛋白 质 编码 序列 间 的 (between two protein-coding 
sequences)33 ,34 
非 同 义 位 点 Cnonsynonymous site)46, 另 见 非 简 并 位 点 ,二 
重 简 并 位 点 
非 整 数 倍 重复 (aneuploidy)83,129 另 见 染 色 体 重复 
废物 DNA Gunk DNA)127-128,131 
Bb Hb (baboons) , 77 BF 3k Al [ey] A BY) 7K FB 120-122 
分 类 学 单位 (taxonomic units)， 操 作 中 的 ， 见 操作 中 的 分 
类 学 单位 
分 离 偏 斜 (segregation distortion )117 
分 离子 基因 (segregator gene)9-10 
分 岐 (divergence ) 
协同 进化 与 (concerted evolution and)102 
核 苷 酸 序列 间 的 (between nucleotide sequences) 31-32, 
32-34,44-45 
分 岐 时 间 (divergence time)42 
的 估计 (人 (estimation of)70-71 
人 与 猿 的 (of humans and apes)49,72-73 
分 子 的 系统 发 育 (molecular phylogeny) 见 系统 发 育 
分 子 古 生物 学 (molecular paleontology)77-80 
分 子 进 化 (molecular evolution ) ,定义 5 
分 子 进 化 的 中 性 学 说 (Cneutral theory of molecular evolu- 
tion)26-27 ,46 
分 子 驱 动 (molecular drive)101-102 
分 子 生 物 学 (molecular biology)5 
分 子 ( 时 ) 钟 (molecular clock(s)48-52 
对 假说 的 挑战 (challenges to hypothesis)49 
人 与 猴 中 的 比较 (comparison in humans and monkeys) 
50-51 
小 鼠 与 大 鼠 中 的 比较 (comparison in mice and rats)50 
路 齿 类 与 灵 长 类 中 的 比较 (comparison in rodents and 
primates)51-52 
相对 速率 测验 与 (relative-rate test and)49-50 
谱系 间 的 变异 (variation among lineages)50-52，71 
分 枝 进 化 (cladogenesis)， 转 座 与 118-119 
负 选 择 Cnegativeselection)17, 另 见 有 害 突变 
附着 位 点 (Cattachment site)9-10 
复合 转 座 子 (complex transposons)107 
复制 滑脱 (replication slippage)12-13,14,101-102,131 
复制 (型 ) 转 座 (replication transposition)105-107,128 
复制 子 基因 (replicator genes)9-10,125-126 


(synonymous substitutions versus) 45- 


G 
5 GE 48 {4 (calcium-binding module) ,依赖 维生素 开 的 


Te 


94 
钙 调 素 基 因 (calmodulin gene) 111 
钙 依 赖 性 调节 蛋白 (calcium-dependent regulator protein) , 
内 部 域 重 复 85-87 
概率 (probability) 
二 项 式 的 (binomial)19-20 
固定 (fixation)22-23 
干扰 素 基 因 (interferon genes)42-43 
甘油 醛 -3- 磷 酸 脱 氢 酶 基因 (glyceraldehyde-3-phosphate 
dehydrogenase gene)113 
rh AY RK FF RE HR BE HK (rate of nucleotide substitutions 
in) 43-44 
高 胆固醇 血 症 (hypercholesterolemia)116 
高 度 重复 的 DNA(highly repetitive DNA 126-127 
散在 序列 (dispersed sequences)127-129 
区 域 性 序列 (localized sequences 126-128 
高 水 平 表 达 的 基因 (highly expressed gene)56-57 
划 兰 氏 阳 性 菌 (Gram-positive bacteria)123 ,124-125,132 
革 兰 氏 阴 性 菌 (Gram-negative bacteria, 123,132 
给 ( 供 ) 体 部 位 (donor site)8,116 
功能 限制 (functional constraints) 
进化 速率 与 45-47 
功能 域 (functional domain) 83 
共同 顺序 (consensus sequence)25 
共 显 性 (codominance)18-19 
构建 系统 树 的 距离 矩阵 法 (distance matrix methods for 
tree reconstruction ) 64-67 , 68-69 
用 于 人 与 猿 的 (for humans and apes) 74-75 
古生物 学 (paleotology) ,分 子 的 77,80 
古 细 菌 (archaebacteria)123 
定 (fixation)16,19-21,22-25,26 
等 位 基因 (allele)20-21,22-25,28 
协同 进化 与 (concerted evolution and)101-102 
定 概 率 (fixation probability)20-21,22-23,24-25,45 
定时 间 (fixation time)22,23-24 
条 件 的 (conditional)23 
光合 细菌 (photosynthetic cyanobacteria)76-77 
滚 环 复 制 (rolling-circle replication)130-131 


H 
哈 迪 - 温 伯 格 平衡 (Hardy-Weinberg equilibrium) 17 
¥ 4A (sponges) ,C 值 125 
i HE FE (seaside sparrow )80-81 
4 i #8 HF (composite transposons) 107 
K $F RB (nucleotides) 
#8 A& (composition) 131 
4 FF YE (diversity ) 25-27 
DNA 序列 中 的 (in DNA sequences) 6 
4E th HE (nonstandard )7 


RNA 序列 中 的 (in RNA sequences)7 
标准 (standard)7 
核 苷 酸 顺 序 (nucleotide sequences)28-37 
线性 排比 (Calignment)34-37 
#a 5 HE (dissimilarity ) 36 
分 岐 (divergence) 31-32 ,32-35,42 
rRNA 77-78 
#A {DL HE (similarity ) 36 
K AF WRF MR (nucleotide substitutions) 11-13, 28-35, 42-59, 
64,91-92 
回复 (backward) 32 
速率 变异 的 原因 (causes of rate variations) 45-47 
并 发 的 (coincidental)32 
趋同 的 (convergent)32 
人 和 猿 与 (humans and apes and)74 
朱 克 斯 和 坎 托 的 一 参数 模型 (Jukes and Cantor's one- 
parameter model)28-31,32-34,41 
木村 的 两 参数 模型 (Kimura's two-parameter model)30- 
32,33-34 
FL 4+ 45 Ot AY YS BA BBP A Cin lysozymes of cows and 
langurs)48 
哺乳 动物 线粒体 中 的 (in mammalian mitochondria )52- 
53 
分 子 时 钟 假 说 (molecular clock hypothesis)48-52 
多 重 (multiple)31-32 
同 义 密码 子 的 非 随 机 应 用 与 (nonrandom usage of syn- 
onymous codons and)55-59 
两 DNA 序列 间 的 数目 Cnumber between two DNA se- 
quences) 31-35 
两 非 编 码 序列 间 的 数目 (number between two noncod- 
ing sequences) 32-34 
两 为 蛋白 质 编 码 序列 间 的 数目 (number between two 
protein-coding sequences)34 
平行 的 (parallel)32 ,48 
假 基 因 中 的 模式 (pattern in pseudogenes)53-55 
植物 核 基因 组 中 的 (in plant nuclear genomes)53 
速率 (rates) 42 
细胞 器 DNA 中 的 速率 (rates in organelle DNA)52-53 
速率 变异 (rate variations)45-47 
沉默 的 (silent)11-12 
物种 比较 (species comparisons)49=52 
物种 分 岐 时 间 估 计 与 (Species-divergence time estima- 
tions and)71 
同 义 的 (synonymous)11=3 
核 苷 酸 蔡 换 的 两 参数 模型 (two-parameter modelof nu- 
cleotide substitution ) 31-34 
核 苷 酸 蔡 换 的 一 参数 模型 (one-parameter model of nu- 
cleotide substitution ) 28-30, 32-34 , 
核 苷 酸 替 换 速 率 (rate of nucleotide substitution ) 24-25, 
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28,30-31542 

RK FF RL A (nucleotide sites) , 另 见 信息 位 点 

简 并 类 型 (degeneracy classes)34-35 
核 骨 架 Cnucleoskeleton)181 
核 类 型 的 DNA(CnucleotypBic DNAJ)131 
核 仁 素 Cnucleolin)59 
核糖 (ribose)6 
核糖 核酸 (ribonucleic acid) 见 RNA 
核糖 体 (ribosome)9-10,77 
核糖 体 蛋 白 17 基因 (ribosomal protein L7 gene)113 
核糖 体 蛋白 L30 基因 113 
核糖 体 蛋白 L32 基因 113 
核糖 体 RNA(Cribosomal RNA) WL rRNA 
核 小 体 Cnucleosome)47,131 
颌 下 腺 型 蛋白 酶 抑制 因子 (submandibular-gland type pro- 

tease inhibitor) 内 部 域 重 复 86-87 
黑猩猩 (chimpanzees)72-76 
红 霉 素 (erythromycin)107 
红色 素 基 因 (red-pigment gene)89 
#& (monkeys) , KF BF HHH 50-51 
& #h DNA (complementary DNA) WL cDNA 
a fbi St iB Bc (slipped-strand-mispairing ) 12-14, 101-102, 
131 另 见 复制 滑脱 

环节 动物 (Cannelids),c 值 125 
环 状 DNA 病毒 (circular DNA viruses)109-110 
回 交 (backcrosses)79 
回 文 (palinodromes)126-127 

中 的 突变 (mutations in)14 

识别 顺序 与 (recognition sequences and)37-38 


J 
PL] AR AB A HE (mechanical incompatibility) , 物种 形成 与 
119 
肌 动 蛋白 基因 (actin genes) 43 
肌 动 蛋白 (actin «)43,50 
肌 动 蛋白 BCactin B)43,50,113 
肌 红 蛋白 基因 (myoglobin;gene)84-85,88,92 另 见 珠 蛋 白 
基因 li 
中 的 核 苷 酸 蔡 换 速 率 (rates of nucleotide substitutions 
in)43 
肌 球 蛋白 轻 链 基 因 (Cmyosin light chain gene) 113 
AL YK BiH (creatine kinase), 同 功 酶 88 
肌 酸 激酶 M 基因 (creatine kinase M gene)43,44 
基因 (gene(s)), 另 见 特异 基因 或 基因 类 型 
编码 区 (coding regions)7-8 
“ 死 的 ?>(“dead”) , 见 假 基因 
定义 (Cdefined)7 
外 源 性 的 (exogenous)106-107 
侧 区 ( 域 ) (flanking regions)8 
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高 度 重复 的 (highly repetitive)88 
水 平 转移 (horizontal transfer)119-122 
低 度 重复 的 (lowly repetitive)88 
不 转录 区 ( 域 )Cnontranscribed regions)8 
垂直 相关 的 (orthologous)90-91 
Hi ® (overlapping ) 95-97 
XE 47 AX AW (paralogous) 90-91 
til JG (processed) 111-112 
重复 的 (repeated)87 
的 沉默 Csilencing of)55 另 见 无 功能 化 
断裂 (split)83 
间 的 替换 速率 变异 (substitution rate variations among) 
47 
内 的 替换 速率 变异 (substitution rate variations within) 
46 
BY 4% $ AY (transcribed )8-10,129 
可 转录 区 ( 域 )(transcribed regions)8 
类 型 (types)7 
不 翻译 区 ( 域 ) Cuntranslated regions)7-8 
基因 表达 (gene expression) ,可 转 座 因子 与 116 
基因 重复 (gene duplication) 38-39,83 
AL DNA 重复 , 域 重 复 , 外 显 子 重复 
完全 的 (complete)83 
年 代 估 计 (estimation of date)90-=92 
内 部 的 (internal)83 
无 功能 化 与 Cnonfunctionalization and)89-91 
部 分 的 (partial)83 
基因 (的 ) 延 长 (gene elongation)85-87 
基因 多 样 性 (gene diversity)24-25 
基因 分 化 (gene splitting)， 和 群体 分 化 与 63 
基因 分 享 (gene sharing)97-99 
基因 家 族 (Cgene families)87-89 
th fal BEAK (concerted evolution)98-103 另 见 协同 进化 
3k E A (globins) 92-93 
基因 结构 (gene structure)7-10 
为 蛋白 质 编码 基因 (protein-coding genes)7-9 
调节 基因 (regulatory genes)9-10 
确定 RNA 的 基因 (RNA-specifying genes)9 
基因 频率 (gene-frequencies) 见 等 位 基因 频率 
St A Mf (gene tree)63 
基因 替换 (gene substitution) 22-25, 31-32 
的 固定 概率 (fixation probability of )22-23 
的 固定 时 间 (fixation time of)23-25 
新 达尔 文 主义 与 (neo-Darwinism and)26 
中 性 学 说 与 (neutral theory and)26-27 
的 速率 (rate of)24-25 
基因 型 (genotypes) 适 合 度 17-18 
基因 选择 (genic selection)18-19 另 见 共 显 性 
固定 概率 (fixation probability)22-23 


基因 转变 (gene conversion ) 127 
协同 进化 与 (concerted evolution and)100-102 
方向 (Cdirection)101 
非 等 位 基因 的 Cnonallelic)101 
基因 组 (genome(s))123-138 另 见 具 体 类 型 ,如 线粒体 基 
因 组 
C 值 Cc values)123 另 见 基因 组 大 小 
真 核 生物 的 结构 (eukaryotic structure)126-129 
细菌 中 的 GC 含量 与 (GC content in bacteria and)131- 
SS 
遗传 重 排 (genetic resetting)118-119 
非 基 因 DNA 与 Cnongenic DNA and)131 
细胞 器 (organelle)52-54 
对 一 的 转 座 影响 (transposition effects on)115-116 
#$ HE DP A AAA 4k (vertebrate organization) 132-138 
基因 组 重复 (genome duplication) 83,129 
基因 组 大 小 (genome size)88 
DNA 重复 与 (CDNA duplication and)83 
真 核 生物 的 (of eukaryotes)125-126 
在 细菌 中 的 进化 evolution in bacteria)123-125 
增加 机 制 (mechanisms for increasing)129-131 
区 域 性 增加 (regional increase)130-131 
基因 组 的 重 排 Cgenomic rearrangements) , 受 可 转 座 因子 
促进 的 116 
基因 组 加 倍 (Cgenome doubling) 见 基因 组 重复 
基因 组 假说 (genome hypothesis)55-56 
基因 座位 (loci)16 
上 的 基因 多 样 性 (gene diversity at)24-25 
多 态 的 (polymorphic)24-25 另 见 多 态 性 
激素 基因 (hormone gene)43 
吉姆 萨 分 带 (Giemsa banding)134 
4 HE oh ® 2 4A (vertebrate genome), 
组 成 上 的 组 织 化 132-138 
RX 26 (echinoderms) ,c 值 125 
剂量 重复 (dose repetitions) 87 
加 工 后 基因 (processed genes),111-112 
另 见 反 录 基因 
加 工 后 假 基因 (processed pseudogenes)111,112-116 
的 进化 Cevolution of)115-116 
加 工 后 序列 (processed sequences)111 
另 见 反 录 序列 
甲 基 化 (methylation)55 
甲壳 类 (crustaceans),c 值 125 
FA iit 2 AR (methionine) 10 
FA ig FA iit 2 AB (formylmethionine) 10,77 
甲状 旁 腺 激素 基因 (parathyroid hormone gene)43,44 
FAR AR ER EA BCthyroglobulin 8)50 
{fi 3£ FA (pseudogenes ) 44-45, 50-51, 75-76, 87, 90, 92-93, 
102-103,122,128 


fy) FF WR AF HB AA SK (pattern of nucleotide substitutions) 
53-55 
tn JG & (processed )89,111-116,122 
另 见 反 录 假 基 因 
AY K FF OR FF PR GE HK Crates of nucleotide substitutions in) 
44-46 
通过 基因 转变 复活 (resurrection by gene conversion) 102 
未 加 工 的 (unprocessed)89-91,122 
间隔 序列 (intervening sequences) , 见 内 含 子 
简 并 类 型 (degeneracy classes) , 核 苷 酸 位 点 34 
减 数 分 裂 (meiosis)9-10,100-101,125-126,131 
交换 (crossing-over)， 不 等 价 ， 见 不 等 价 交换 
酵母 (yeast) 另 见 saccharomyces cerevisiae 
同 义 密码 子 的 非 随机 应 用 Cnonrandom usage of synony- 
mous codons)55-57 
rRNA 基因 (rRNA gene)88 
可 转 座 因子 (transposable elements)116 
结构 基因 (structure genes)7 另 见 为 蛋白 质 编码 的 基因 ， 
确定 RNA 的 基因 
植物 线粒体 中 的 (in plant mitochondria)52 
原核 生物 中 的 (in prokaryotes)8-9 
在 细菌 中 的 转录 (transcription in Easyg 和 
结构 组 件 (structural module(s)83 , 另 见 域 
截 尾 (truncation)， 加 工 后 假 基 因 112-113 
金属 琉 基 组 氨 酸 三 甲 ( 基 ) 内 盐 工 基因 (metallothionein 1 
gene)44 
进化 的 维 苏 威 模式 (Vesuvian mode of evolution)114-116 
进化 的 综合 学 说 (synthetic theory of evolution )26-27 
支 序 图 (cladogram ) ,又 译 进化 树 68,72 
进化 速率 (evolutionary rate) ,功能 限制 与 ,45-47 
支 序 (clades)71-72 
A. 53 (humans and apes)73 
支 序 系统 学 (cladistics) ,与 表 型 学 对 应 68-69 
近邻 结合 法 (neighbor-joining method), 用 于 系统 树 构 建 
的 67 
精 氨基) 琥珀 酸 合成 酶 基因 (argininosuccinate synthetase 
gene)113 
精 氨基) 琥珀 酸 裂解 酶 (argininosuccinate lyase)98-99 
距离 法 (distance methods) 69 
距离 指数 (distance index)， 线 性 排列 中 的 36-37 
决定 互补 性 的 区 域 (complementarity determining regions, 
CDRs)45-46 
决 ( 确 ) 定 性 模型 (deterministic models)16 
绝对 适合 度 (Cabsolute fitness)17 
蕨 类 (pteridophytes),C 值 125 


K 


开 读 框架 (open reading frames, ORFs) 52,107,109-110, 
128 
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可 ( 移 ) 动 因子 (mobile elements) JL hy JE AT 
可 转录 因子 (transcribed genes), # AA tu B 129 
可 转 座 因子 (transposable elements) 106-110, 119-120,123- 
124,129-130 
f€ X (defined) 105 
供 体 部 位 (donor site) 106-107 
拷贝 数 的 进化 动力 学 (evolutionary dynamics of 0 
number)119-120 
基因 表达 与 (gene expression and)115-116 
插入 序列 (insertion sequences)106-107,123-124 
P-M 劣势 与 (P-M dysgenesis and)117-118 
J & AF retroelements) 107-110 
#P 3B fiz (target site) 106 
#& WE F-(transposons) 106-108 . 
空缺 碱 基 Cnull base) ,线性 排列 中 的 34-36 
框架 移动 突变 (frame:shift mutation)14,89-90 
昆虫 (insects)c 值 125 


L 
蓝 色 素 基 因 (blue-pigment gene) 89 
蓝 细 菌 (cyanobacteria)77-78,123,124-125 
类 人 猿 科 (hominoidea) 系 统 发 育 72-76 
相似 性 指数 (similarity index) 线 性 排比 中 的 36 
#8 (Cyprinus car pio) ,C 值 134-135 
All #8 7 (rifampicin )77 
if $8 BH (ligase) 37 
ke RF (streptomycin) 77 
BA 1% 1K (diploid) 17,19 
PA A 2E (amphibian) ,C {@ 124-125 
¥ H# (dysgenesis) ,杂种 116-119 
33 4% (gap(s))14,34-36 
最 小 化 (minimization )35-36 
末端 的 (terminal)35-36 
裂缝 处 罚 (gap penalty)36-37 
磷酸 丙 糖 异 构 酶 基因 (triosephosphate isomerase gene)113 
磷酸 二 酯 键 (phosphodiester bonds)6-7 
磷酸 甘油 酸 激 酶 多 (基因 ) 家 族 (phosphoglycerate kinase 
(PGK) multifamily)111, 113 
ig $4 A (lepidoptera) 81-82 
RKA (primates) , KH BF RH 51-52 
绿色 素 基因 (green-pigment gene)89 
绿色 菠 类 (gree algae)77-78 
毛 霉 素 (chloramphenicol)77 
卵 类 粘 蛋 白 基 因 (ovomucoid gene) , 域 重 复 与 85-87 
裸子 植物 (gymnosperms),C 值 125 


M 


Hi (cats), 来 自 独 独 的 病毒 基因 水 平 转移 120-122 
猪 白 血 病 反 录 病毒 (feline leukemia retrovirus)109-110 


¢ ge 。 


Hi Bt (felidae) 120-122 
帽子 部 位 (cap site)7-8,111 
酶 (enzymes) 
异型 酶 (allozymes)88 
同 功 酶 (isozymes)88-89 
限制 酶 restriction ) 见 限制 性 内 切 核 酸 酶 
备 德 尔 式 分 离 (Mendelian segregation)19 
备 德 尔 主 义 (Mendelism)26 
喀 啶 (pyrimidines)6,11-12 
密码 子 (codon)9-10 
中 的 核 苷 酸 替 换 (nucleotide substitution in)11-13 
同 义 的 (synonymous) 见 , 同 义 密码 子 类 型 10 
应 用 模式 (usage pattern)55-59 
密码 子 一 反 密 码 子 配对 (codon-anticodon pairing)56-57 
密码 子 族 (codon family)10 
免疫 球 蛋 白 基 因 (immunoglobulin genes)43 
高 可 变 区 (hypervariable regions)45-46 
内 部 域 重 复 (internal domain duplications)85-87 
中 的 非 同 义 与 同 义 替 换 对 应 
synonymous substitutions in )45-46 
中 的 核 苷 酸 蔡 换 速率 (rates of nucleotide substitutions 
in)43 
灭绝 (Cextinction ) ,等 位 基因 20-21 
膜 翅 目 (hymenoptera)129 
木村 的 两 参数 模型 (Kimura's two-parameter model) 30- 
32,33-34,41 


(nonsynonymous versus 


N 

Pa dE Bt FP (quagga) 80 

南 4 4 4 (south American marsupials), RAA| WAR 

4 5 80-81 

内 部 重复 (internal repeats)83,114 

内 共生 学 说 (endosympbiotic theory)77-78 

内 & Ff (intron (s)7-8,25,52,58-59,83,85-87 ,93-94,103 
a14a97-98 . 
4b ft 4 A (exon insertion into) 
的 丧失 (loss of )84-85 
的 数目 (number of )8-9 
的 相位 (phases of )95-96 

内 含 子 编码 的 蛋白 质 (intron-eacoded iti 变通 的 拼 

接 与 97-98 

内 切 核酸 酶 (endonucleases)97 

内 源 性 反 录 病毒 序列 (endogehous retroviral sequences) 

120-122 

内 转录 间隔 (internal transcribed spacer)99 

拟 反 录 病 毒 (pararetroviruses)108-110 

“粘性 末端”(“sticky ends”)37 

鸟 类 (bird),C 值 125 

鸟 味 叭 


外 显 子 混 匀 


(Cguanine)6-7 


尿 激 酶 Curokinase)93-94 

尿 激 酶 原 (prourokinase)94 

尿 激 酶 一 血 纤 蛋白 溶 酶 原 活化 因子 基因 (urokinase-plas- 

minogen activator gene)43 

BR BE ME Curacil)7 

mie Py AE (rodents ) 
KE BE HK HF (nucleotide substitutionrates)50,51-52 
反 录 假 基 因 (retropsendogenes) 113 

凝血 酶 (thrombin)87 

凝血 酶 原 (prothrombin)93-94 

纽 结 杆 状 组 件 (Kringle module)93-94 


P 
N@ 4 2K (reptiles) ,72 
C {fi (c values) 125 
Ac F (gametes) ,随机 取样 20-21 
配子 的 随机 取样 (random sampling of gametes)19-20 
匹配 碱 基 (Cmatched bases) ,对 子 34-36 
1 (purines) 6, 11-12 
HH (splicing), 438 A) 97 
拼接 功能 Csplicing function) 见 拼接 位 点 
拼接 位 点 Csplicing sites)8,37,85,97-98 
平衡 选择 (balancing selection)18-19,20-21,26 
平行 相关 (paralogy)90-91 
瓶颈 (battleneck)22 ,27 
普 里 伯劳 块 (Pribnow box)8-9 
普 适 遗传 密码 (universal genetic code)10,34-35 


Q 

期 望 杂 合 度 (expected heterozygosity)24-25 

起 始 密码 子 (initiation codon) 

迁移 (migration)16,20 

前 病毒 (provirus)108-109 

前 mRNA (pre-mRNA)7-8,111 

前 生物 进化 (prebiotic evolution) 5 

前 胰岛 素 原 I 基因 (preproinsulin I gene)103,111-112 

前 胰岛 素 原 工 基 因 (preproinsulin I gene)103,111-112 

Fe Bi RS BERK HE EH & BS A Chydroxanthine phos- 
phoribosyltransferase gene) 43 

强化 因子 (enchancers)115-116 

强 键 (strong bond)6 

切 离 修 复 (excisionrepair)14 

@ # (hydrogen bonds) ,形成 互补 碱 基 配 对 6 

区 域 性 重复 (regional duplication )83 

区 域 性 重复 序列 (localized repeated sequences)125-128 

趋同 进化 (convergent evolution)80 

取样 (sampling) ,随机 19-20 

醛 缩 酶 (aldolase) , 同 功 酶 88 

醛 缩 酶 A 基因 (aldolase A gene)43-44,50 


缺失 (deletions)11-14,34-35,52,114,116 
确定 RNA 的 基因 (RNA-specifying genes)7,8-10,88,125- 
126 另 见 结构 基因 
群体 大 小 (population size)19-20 
有 效 (Ceffective)20-22 
[Al = #44 45 fixation probability and)22-23 
随机 遗传 漂 变 与 (random genetic drift and)20-21 
群体 分 化 (population splitting) ,基因 分 化 与 63 
群体 遗传 学 (population genetics)5,16 
等 位 基因 频率 变化 (allele frequency changes)16-17 
有 效 群 体 大 小 (effective population size)20-22 
基因 替换 (gene substitution) 22-25 
自然 选择 Cnatural selection)17-19 
新 达尔 文学 说 (Cneo-Darwinian theory)26-27 
中 性 突变 假说 Cneutral mutation hypothesis) 26-27 _ 
4 4 tt (polymorphism) 24-26 
随机 遗传 漂 变 (random genetic drift) 18-20 


R 
Ye f4 8 {AK (chromatid )110-101 
Ye f4 {K (chromosome) 83 
基因 转变 与 (gene conversion and) 100-102 
机 制 不 相 容 性 (mechanical incompatibility)83 
不 等 价 交 换 与 (unequal crossing-over and)69,71 
染色 体重 复 (chromosomal duplication)83 ,129-130 
部 分 的 (partial)83 
热 冲 击 蛋白 质 (heat-shock proteins)98-99 
人 -大 猩猩 -黑猩猩 三 分 又 (human-gorilla-chimpanzee)73- 
76 
人 的 基因 (human genes) 
密码 子 应 用 模式 (codon-usage patterns)56-58 
RK TF ORF HR EK (nucleotide substitution rates)51 
反 录 假 基 因 (retropseudogenes) 113 
人 科 (hominidae)72-73 
人 类 的 系统 发 育 (human phylogeny)72-76 
YS Fa BH (lysozyme) 87 
中 的 正 选 择 (positive selection in)48 
肉 足 类 (原生 动物 )(Csarcodina)C 值 125 
¥L + (cows) ,中 的 溶菌 酶 48-49 
乳 清 蛋白 (lactalbumin787 
乳酸 脱氧 酶 (lactate dehydrogenase)103 
同 功 酶 (isozymes)88-89 
乳酸 脱 氢 酶 A 基因 (lactate dehydrogenase A gene)43-44, 
50 
乳酸 脱 氢 酶 B 基 因 98-99 
软体 动物 (mollusks),C 值 125-126 
弱 键 (weak bond)6 
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萨 塔 斯 和 特 韦 尔 斯 基 法 (Sattath and Tversky’s method ) 
见 近邻 关系 法 
三 色 性 (trichromotism)89-90 
三 体 (trisomies)129-130 
散在 重复 序列 (dispersed repeated sequence)127-129 
色 敏 感 色素 蛋白 (color-sensitive pigment proteins)89 
色素 蛋白 (pigment protein) ), 色 人 敏 威 的 89 
¥% (sharks) ,C 值 125-126 
上 游 方向 (Cupstream direction) ,DNA 序列 1 
YE 4, Ys HE E (dusky seaside sparrow)80-81 
生命 的 起 源 (origin of life)5 
生长 激素 基因 (growth hormone gene)43-44,50 
生长 激素 释放 抑制 因子 -28 基因 (somatostatin-28 gene)43 
生长 因子 组 件 (growth-factor module)94 
生殖 (reproduction), 有 差别 的 , 见 自然 选择 
识别 顺序 (recognition sequences) 37 ,39 
世代 时 间 效 应 (generation-time effect)51-52 
适合 度 (fitness)17-19,127-128 另 见 自然 选择 
绝对 (absolute)17 
相对 (relative)17 
嗜 热 细菌 (thermophilic bacteria)131,137 
We BA AK Mu(bacteriophage Mu)105,107-108 
WE PA AK Dx174 96 
噬菌体 , 转 座 107-108 
收缩 系统 蛋白 基因 (contractile system protein gene)43 
受 体 部 位 (acceptor site)8, 116 
双 翅 目 (diptera)81-82 
W# DNA (double -stranded DNA) 
反问 平行 结构 (antiparallel structure) 6-7 
DNA-DNA 杂交 与 CDNA-DNA hybridization and)40 
后 随 链 (lagging strand)55 
前 导 链 (leading strand)55 
热 稳 定性 (thermal stability)40 
双子 叶 植 物 (dicotyledons)53 
水 平 基 因 转 移 (horizontal gene transfer)119,119-122 
水 平 进化 (horizontal evolution ) 另 见 协同 进化 
顺 向 重复 (direct repeats)105 
顺序 -线性 排比 距离 法 (sequence-alignment ) , ,顺序 线性 排 
比 中 的 35-37 
点 阵 法 (dot matrix method)35-36 
顺序 -距离 法 (sequence-distance method) 顺序 线性 排比 中 
的 35-37 
“ 死 基 因 ”(“dead genes”) 见 假 基 因 
四 重 简 并 核 苷 酸 位 点 (fourfold degenerate nucleotide sites) 
34-35 ,44-45 
点 条 件 four-point codition) 66-67 
4- Bit. FR MB WE AK $F (4-thiouridine) 56-57 
松 驰 肽 基因 (relaxin gene) 43 
速率 恒定 假定 (rate-constancy assumption)48-49,91 
° 168 » 


随机 交配 (random mating) 17 
随机 模型 (Sltochastic models) 16 
中 性 学 说 与 Cneutral theory and)26 
随机 遗传 漂 变 (random genetic drift)16-17,18-21,48-49 
梭 状 芽孢 杆菌 (clostridia)132 


T 
糖 蛋白 激素 « WE (glycoprotein hormone a subunit)51 
唐 氏 综合 性 (Down's syndrome) 129 
特征 状态 法 (character-state methods)69 
体 细 胞 突变 (somatic mutations)11 
替换 (Csubstitution ) 见 基因 替换 , 核 苷 酸 蔡 换 
条 件 固 定时 间 (conditional fixation time)23-24 
调节 基因 (regulatory gene)7,9-10,125-126 
铁 氧 还 蛋白 (ferredoxin) ,内 部 域 重 复 85-87 
同 功 酶 (isozymes)88-89 
同 义 密码 子 (Synonymous codons)10 
非 随机 应 用 (Cnonrandom usage)55-59 
同 义 替 换 (synonymous substitutions)11-13,55-59, 91, 97 
另 见 核 苷 酸 蔡 换 
与 非 同 义 替 换 对 应 (nonsynonymous substitutions 
versus)45-46 
速率 (rates)42-45,52-54 
两 为 蛋白 质 编 码 序 列 间 的 (between two protein-coding 
sequences ) 33-34 
基因 间 的 变异 (variations among genes) 47 
fr) SZ fiz A (synonymous sites)46-47 另 见 四 重 简 并 位 点 
同 源 双 链 DNA Chomoduplex DNA)40 
同 源 序列 (homologous sequences) ,分 岐 42 
同 质 段 (isochores)47,134 
中 的 基因 位 置 (gene location within)134,136 
起 源 (origin)136-138 
突变 (mutation(s)11-14,16,20-21 另 见 核 苷 酸 替 换 
有 利 的 (advantageous) 见 有 利 突 变 
定义 (defined)11 
fit (deletions) 12-14 
HE 48 & Bh (frameshift) 14 
细菌 中 的 GC 含量 与 (GC content in bacteria and)132- 
133 
热点 (hotspot)14 
插入 (insertions)12-14 
中 性 的 Cneutral) 见 中 性 突变 
点 (point)11,53-54 
体 细胞 的 (somatic)11 
空间 分 布 (Sspatial distribution )14 
自发 的 (Spontaneous)53-55 
同 义 的 (synonymous) , 见 同 义 密 码 子 ， 
同 义 替 换 
类 型 (types)11 


突变 的 热点 (hotspots of mutation) 14 

突变 率 (rate of mutation) 23-25,45,46-48 

突变 论 者 的 假说 (mutationist hypothesis) 137-138 

突变 模式 (mutation pattern)53-55 

推论 的 系统 树 (inferred phylogenetic trees)62-63 另 见 系 
统 树 

脱氧 核糖 (deoxyribose) 6 

脱氧 核糖 核酸 (deoxyribonucleic acid), 见 DNA 

拓扑 图 (学 )(topology), 见 系统 树 


WV 
外 膜 蛋白 工 基因 (outer memberane protein I gene,omp 
A)56 
db Sit F (exon (s)8,25,83,93-94,97 
AB Xt #K A (asymmetrical) 95,103 
2 HW (classes) 95 
dX 5 (domains and) 83-85 
25 |B] 4} 7G (spatial distribution ) 8-9 
Xt HF AY (symmetrical) 95,103 
外 显 子 插入 (exon insertion) 92-93 ,95 
外 显 子 重复 (exon duplication)84-86,92-94, 另 见 DNA 重 
WER 
外 显 子 混 匀 (exon shuffling) 83,92-96 
8 tk HA J 45 (mosaic proteins and) 93-94 
相位 限制 (phase limitations) 93-96 
外 源 性 基因 (exogenous genes)106-107 
外 转录 间隔 (external transcribed spacers)99 
完全 变态 昆虫 (hemimetabola)81 
为 蛋白 质 编码 的 基因 (protein-coding genes)7-9,102,123- 
124 另 见 结构 基因 
叶绿体 中 的 (in chloroplasts)52 
真 细 菌 中 的 (in eubacteria)8-9 
哺乳 动物 线粒体 中 的 (in mammalian mitochondria)52 
FF RE HR (nucleotide substitution)11-14,32,34 
植物 线粒体 中 的 (in plant mitochondria) 52 
替换 速率 (substitution rates)42-45 
在 真 核 生 物 中 的 转录 (transcription in eukaryotes)8 
在 原核 生物 中 的 转录 (transcription in prokaryotes)8-9 
卫星 DNA (satellite DNA)127,129-130,131 
稳定 化 选择 (stabilizing selection)18-19 
无 根系 统 树 Cunrooted phylogenetic trees)61-62,69 
寻根 (rooting) ,70-71 
Fe i f4 FE (agnathes) 91-92 
C {BH (c values) 125 
FE  % #3 F (nonsense codon) ) 见 终止 密码 子 
Zi & % 4 (nonsense mutations) 11-13 
物种 分 岐 时 间 (species-divergence times) 
估计 (estimation)70-71 
X. 54g Chuman and ape)72-76 


1) FH AY (species trees) 62-63 
物种 形成 (speciation ) , #% AE 4118-119 
TR SL 38 AE (missense mutations) 11-13 


xX 
KGAA (phylogeny)5,49,60-81 
特征 状态 法 (character-state methods) 69 
支 序 (clades)69-70 
保护 生物 学 与 (conservation biology and)80-81 
距离 法 (distance approaches)69 
在 基因 重复 事件 的 年 代 测 定 中 (in gene-duplication 
event dating)90-92 
A. 538 Chumans and apes)72-76 
分 子 数据 的 影响 (impact of molecular data) 60 
线粒体 与 叶绿体 (mitochondria and chloroplast)77 
分 子 古 生物 学 (molecular paleontology )77,80 
物种 分 岐 时 间 估 计 (species-divergence time estimation) 
71 
¥% 4M (phylogenetic tree(s) )60-72 
tn tE AY (additive) 61-62 
两 分 叉 节 点 (bifurcating nodes) 61-62 
分 枝 (branches)61 
分 枝 模 式 (branching pattern)61, 另 见 拓扑 图 
枝 长 (branch length)61,69-70 
定义 (Cdefined)61 
外 部 节点 (external nodes)61 
基因 (gene)63 
水 平 基因 转移 与 (horizontal gene transfer and)121 
推论 的 (Cinferred)62-63 ,69 
内 部 节点 (internal nodes)61 
最 节省 (maximum parsimony)67 
多 分 叉 节点 Cmnultifurcating nodes)62 
节点 (Cnodes)61 
fj YE (reconstruction methods)64-68 , 另 见 系统 树 构 建 
用 于 相对 速率 测验 的 (for relative-rate test)49-50 
有 根 的 (rooted)61-62 
寻找 无 根 树 的 根 (rooting unrooted trees)70-71 
有 尺度 的 分 枝 (scaled branches)61 
物种 (Species)63 
拓扑 图 (topology)61-66 另 见 系 统 树 构建 
无 根 的 (unrooted)61-62,67-68,70,76-77 
无 尺度 的 分 枝 (unscaled branches)61 
细胞 角 和 蛋白 内 A 基因 (cytokeratin endo A gene)113 
细胞 器 DNA (organelle DNA) ,中 的 替换 速率 ,52-54, 另 见 
线粒体 . 叶绿体 
细胞 色素 CCcytochrome C)48-49 
细胞 色素 C 基因 (cytochrome C gene)48-49,113 
细胞 型 (cytotype)117 
细菌 (bacteria ) 
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GC 含量 (GC content)131-134 
中 的 基因 组 大 小 的 进化 (genome size evolution in)123- 
124 
细菌 转 座 子 (bacteria transposons)107-108,115-116 
下 游 方向 (downstream direction) ,DNA 序列 6 
纤毛 虫 (Cciliophora) ,C 值 125 
纤毛 虫 类 (ciliates)77-78 
纤维 糖 素 (fibronectin)93-94 胃 
限制 片段 模式 (restriction-fragment patterns) 37, 38-40, 
79-81 
限制 图 谱 (restriction map)37-39,38-40,41 
限制 位 点 (restriction sites)37,99-101 
限制 性 内 切 核酸 酶 (restriction endonucleases)37-40 
Bam 1 38-39 
Bbv 1 37-39 
Bgl 1101 
EcoR | 37,39,100 
Hae 1 37-39 
Hind 1 37,100 
Hind I 38-39 
Hinf | 37-39 
H pa 1 99-100 
Nei | 37-39 
Not 1 37-39 
Pvu 1101 
识别 顺序 (recognition sequences) 37-39 
拼接 位 点 (Csplicing site)37 
粘性 未 端 Csticky ends)37 
线粒体 DNA (mitochondrial DNA)79-81 
线粒体 基因 组 (mitochondrial genomes) 10, 95-96 
的 内 共生 起 源 (endosymbiotic origin of )77 
哺乳 动物 的 (mammalian)52-53 
植物 (plant)52-53 
线粒体 遗传 密码 (mitochondria genetic code) ,哺乳 动物 的 
10-11 
线性 排比 (Calignment)34-37 
点 阵 法 (dot matrix method)35-36 
顺序 -距离 法 (sequence-distance method)35-37 
Wie GR (adenine) 6-7 
相对 适合 度 (relative fitness) 17 
相对 速率 测验 (relative-rate test) 49-50 
人 对 猴 的 (for humans versus monkeys) 50-51 
小 鼠 对 大 鼠 的 (for mice versus rates)50 
ii Py FE XT 52 4 AE AY Cfor rodents versus primates)51-52 
aE tte FE Sit (mosaic proteins) 93-94 
/\\ BE A (parvalbumin) ) ,内 部 域 重 复 86-87 
小 分 子 细 胞 核 RNA(small nuclear RNA), AL snRNA 基因 
小 分 子 细胞 质 RNA (small cytoplasmic RNA) , 见 sRNA 
基因 
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/\y BA (mice ) , 核 苷 酸 蔡 换 速 率 50 
协同 进化 (concerted evolution)92-93 ,98-103 
进化 论 含意 (evolutionary implications)101-103 
机 制 (mechanisms)100-102 
心房 钠 泵 因子 (atrial natriuretic factor)50 
新 达尔 文学 说 (neo-Darwinian theory)26-27 
信使 RNA (messenger RNA) , 见 mRNA 
信息 位 点 (informative sites)67-68,75-76,81 
猩猩 科 (pongidae)73 
猩猩 亚 科 (ponginae)73 
性 别 决 定 (sex determination) ) ,变通 的 拼接 与 ,97-98 
性 致死 基因 (sexlethal(szz)gene)97-98 
胸腺 喀 啶 (thymine)6-7 
选择 (selection)， 见 自然 选择 
选择 论 者 的 假说 (selectionist hypothesis)136-137 
选择 强度 (selection intensity) , 核 苷 酸 蔡 换 速率 与 ,47 
选择 优势 (selective advantage) 见 有 利 突 变 
定 概率 与 (fixation probability and)22-24 
定时 间 与 (fixation time and)23-24 
选择 中 性 (selective neutrality)55 另 见 中 性 突变 
下 的 核 苷 酸 替 换 模式 (pattern of nucleotide substitution 
under)53-54 
i #F = MX (selectionism) 26 
与 中 性 主义 对 应 (neutralism versus) 27 
血红 和 蛋白 (hemoglobin)48-49 
恒 春 (Constant Spring)85 | 
Tearia85 
血红 蛋白 基因 (hemoglobin genes)92, 另 见 珠 蛋 白 基因 
中 的 核 苷 酸 蔡 换 速 率 (rate of nucleotide substitutions 
in)43 
血清 白 蛋白 (serum albumin) 43, 85-86 
内 部 域 重 复 (internal domain duplication)85-86 
i A & A Cfibrin) 93 
血 纤 蛋白 溶解 作用 (fibrinolysis)92 
i 4 & A YH Bi JR (plasminogen) 93-94 
内 部 域 重复 (internal domain duplication) 85-86 
血 纤 蛋白 原 (fibrinogen794 
r 基 因 (r gene)43 
血液 凝固 (blood coagulation)93-95 


Y 

鸦片 黑 素 皮质 激素 原 基 因 (proopiomelanocortin gene) 50, 
113 

WW 2& FA 4 HH AY DNA (subgenomic circular DNA)52 

W. ## (subspecies ) 80 

KEE BE HZ AR OE WS — 4% $F MB (nicotinamide adenine dinucleotide 
(NAD* )89 

AR 4 38 Ceuglenozoa), C {#125 

(AR) da 4 3 & (crystallins) ,基因 分 享 97-99 


摇摆 Cwobbling)56-57 
野生 型 等 位 基因 (wild-type allele), 
突变 型 等 位 基因 替代 22-25 
叶 猴 (Clangurs) ,的 溶菌 酶 48-49 
叶绿体 基因 组 (chloroplast genomes)10 
的 内 共生 起 源 Cendosymbiotic origin of)77-78 
替换 速率 (substitution rates)52-54 
4K i DNA 的 RNA & 3 fi (DNA-dependent RNA poly- 
merase), KL RNA 4 RB 
依赖 S- 腺 苷 甲 硫 氢 酸 的 甲 基 化 酶 (s-adenosylmethiomine- 
dependent methylase)107 
依赖 Vk 的 钙 结合 组 件 (CvitaminK-dependent calcium-bind- 
ing module)93-94 
胰 蛋 白 酶 (trypsin)85,87,93-94 
胰岛 素 基 因 (insulin gene) ,中 的 核 苷 酸 蔡 换 速 率 43-44 
A 和 B 链 (A and B chains)46-47 
C- 肽 基因 (C-peptide gene)46-47 
胰岛 素 样 生 长 因子 工 基因 (insulin-like growth factor I 
gene)43,50 
胰岛 素 原 基因 (proinsulin gene), 替换 的 速率 46-47 
遗传 重 排 (genetic resetting)119 
遗传 多 态 性 (genetic polymorphism) I & A HE 
遗传 密码 (genetic code)9-11 
的 简 并 (degeneracy of)10,55 
哺乳 动物 线粒体 的 (mammalian mitochondrial) 10-11, 
34-35 
普 适 的 (universal)10,34-35 
乙肝 病毒 (hepatitis B virus)109-110 
乙酰 胆 碱 受 体 r 亚 基 基因 (acetylcholine receptor r subunit 
gene)43 
蜡染 色 质 (heterochromatin)129-130 
异型 酶 Callozymes)88 ,89 
异 源 双 链 DNA(heteroduplex DNAJ)40 
易 位 (translocation)116 
Fl --IX 基因 (factor-IX gene)93-94 
外 显 子 定位 (exon localization ) 8-9 
应 答 者 基 JE 位 (Responder locus), HA CD. 
melanogaster) 127-128 
用 于 系统 树 构 建 的 近邻 关系 法 Cneighbor relation methods 
for tree reconstruction ) 66-67 ,68,81 
A. 45 3g 5 (for humans and apes)75 
有 差别 的 生殖 (differential reproduction) ), 见 自然 选择 
#4828 (marsupials), 4>- 4 +A W480 
有 根 的 系统 树 (rooted phylogenetic tree )61-62 
有 功能 基因 (functional gene) ,与 加 工 后 假 基 因 对 应 112- 
ES 
AI & ®R 7K (deleterious mutation ) 
定 概 率 (fixation probability ) 23 
固定 时 间 (fixation time) 17,23-24,45-46,87 


Aj Fil 3 4E (advantageous mutation (s) 16-18, 26-27, 45-46, 
48-49 另 见 正 选 择 
的 固定 概率 (fixation probability of)22-23 
的 固定 时 间 (fixation time of)23-24 
基因 替换 的 速率 (rate of gene substitution )24 
有 利 选 择 (advantageous selection)17,45-46 另 见 正 选 择 
有 丝 分 裂 (mitosis)9-10,100-101,125-126,131 
有 效 群体 大 小 (effective population size)20-23 ,27 
长 期 (long-term)22 
有 意义 密码 子 (sense codons)10,85 
中 的 核 苷 酸 蔡 换 (Cnucleotide substitution in)11-13 
诱 变 剂 (mutagens)52-53,131 
鱼 类 (fishes) ,C 值 125 
Sa (domain(s) 
xe XL (defined )83 
Sb fit F 45 (exons and)83-85 另 见 外 显 子 中 的 条 目 
功能 的 (functional)46,83 
结构 的 (structural)46,83, 另 见 组 件 
域 重 复 (domain duplication )84-87 
卵 类 粘 蛋 白 基 因 与 (ovomucoid gene and)85-87 
的 普遍 性 (prevalence of )85-87 
原核 生物 (prokaryotes) 
内 共生 学 说 与 (endosymbiotic theory and)77-78 
中 的 结构 基因 (structural genes in)8-9 
原 肌 球 蛋白 (tropomyosin) , 非 肌 的 113 
原 肌 球 蛋白 a 链 (tropomyosin a chain) 
内 部 域 重 复 85-87 
原生 生物 (protists)77-78 
猿 类 (apes)， 的 系统 发 育 72-76 
阅读 框架 (reading frame)9-10 


Z 
42 & fF (heterozygotes) 
tt ff + 5 (codominance and) 18-19 
超 显 性 与 Coverdominance and)18-19 
配子 的 随机 取样 与 (random sampling of gametes and)19 
杂种 DNA (hybrid DNAJ) 见 异 源 双 链 DNA 
杂种 劣势 (hybrid dysgenesis)116-118 
物种 形成 与 (speciation and)118-119 
载 脂 蛋 白 基 因 (apolipoprotein genes)43-44,46-47 
载 脂 蛋白 A- I 43,50-51 
载 脂 蛋白 A- N 43-44 
# 9G EG E 43-44,50 
MK (algae) .C 14.125 
沼泽 地 人 (bog people) 80 
真 骨 鱼 (bony fishes) ,C 值 125 
真 核 生 物 (eukaryotes) 
内 共生 学 说 与 (endosymbiotic theory and)77-78 
基因 结构 (gene structure)6 ,84-85 
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基因 组 重复 (genome duplication )129 
基因 组 大 小 (genome size)124-127 
为 蛋白 质 编 码 基 因 的 结构 (protein-coding gene struc- 
ture)7-9 
重复 基因 组 结构 (repetitive genome structure)125-129 
真菌 (fungi)77-78 
真实 系统 树 (true phylogenetic trees)62-63, 另 见 系 统 树 构 
建 
真 细 菌 (eubacteria)77-78 
C 值 (C values)123-124 
中 的 GC 含量 (GC content in)131-133 
中 的 为 蛋白 质 编码 基因 (protein-coding gene in)8-9 
正 选 择 (positive selection)17,45-46, 另 见 有 利 突变 
乳牛 和 叶 猴 的 溶菌 酶 中 的 (in lysozymes of cow and jan- 
gurs)48-49 
支原体 (mycoplasmas)123-124,132 
rRNA 基因 (rRNA.genes)88 
枝 长 估计 (branch length estimations)69-70 
直 翅 目 (orthoptera)81-82 
指 状 组 件 (finger module)93-94 
植物 基因 组 (plant genomes) ,替换 速率 52-54 
植物 线粒体 基因 组 (plant mitochondrial genome)52-54,77 
替换 速率 (substitution rates)52-53 
质粒 (plasmids)107-108 
A) DNA 起 源 (DNAoriginating 记 )123-124 
质 体 (plastids)， 见 叶绿体 
中 度 重 复 DNA (middle-repetitive DNA)125-127 
中 性 突变 Cneutral mutation)17,45-46, 另 见 选 择 中 性 
的 固定 概率 (fixation probability of)22-23 
的 固定 时 间 (fixation time of)23-24 
基因 替换 的 速率 (rate of gene substitution)24-25 ,45-46 
终止 密码 子 (stop codons, termination codons)8,9-11,85, 
89-90 ,97-98 
框架 移动 突变 与 (frameshift mutation and)14 


肿瘤 抗原 P53 基 因 (tumor antigen P53 gene)113 
种 系 细胞 (germ-line cells)， 中 的 突变 , 见 突变 
朱 克 斯 和 坎 托 的 一 参数 模型 (Jukes and Cantor's one-pa- 
rameter model) 28-31 ,32-34,41 
朱 克 斯 和 坎 托 公 式 (Jukes and Cantor's formula) 34 — 
珠 蛋 白 基 因 (globin gene) 另 见 某 些 具体 类 型 ， 如 肌 红 和 蛋 
白 
染色 体位 置 (chromosomal location)92 
进化 史 (evolutionary history)92-93 
家 族 (families)88 ,92-93 
GC 含量 (GC content)134-137 
进化 中 的 内 含 子 丧失 (intron loss during evolution )84- 
85 
超 家 族 (superfamily)88 , 92-93 
1 


珠 蛋 白 假 基因 (globin pseudogenes) ,缺陷 89-91 
主 组 织 相 容 复合 体 基 因 (major histocompatibility complex 
genes)102-103 
中 的 非 同 义 对 同 义 蔡 换 (nonsynonymous versus api 
mous substitution in)45-46 
转化 基因 (transformer (tra) gene)97-98 
转换 (transition)11-12,30-32,34-35 
转录 (transcription)7-8,77,111,129 
转录 起 始 部 位 (transcription initiation site)7-8,102 
转录 终止 部 位 (transcription termination site)7-8 
转移 RNA (transfer RNA) 见 tRNA 
转 座 (transposition)101-102,105-122,129-130 
保守 (型 ) (conservative)105-107 
定义 (defined)105 
重复 型 ty 105-107 
对 宿主 基因 组 的 效应 (effects on host genome)115-116 
水 平 基 因 转 移 (horizontal gene transfer)119-122 
杂种 劣势 与 (hybrid dysgenesis and)117-118 
复制 型 (replicative)105-107,128 
反 录 序列 与 (retrosequences and)110-116 
物种 形成 与 (speciation and)118-119 
可 转 座 因子 拷贝 数 与 (transposable-element copy num- 
ber and)119-120 
可 转 座 因子 与 (transposable elements and) 106-110 
类 型 (types)105 
转 座 酶 (transposase)106-107 
PE WE IME BA (AK (transposing bacteriophages)107-108 
& i F (transposons) 106-108 
58 & (complex) 107 
& i& (composite ) 107 
对 宿主 基因 组 的 效应 (effects on host genome) 115-116 
TOY 
Tn9 107 
Tnl10 105,116 
Tn21 107-108 
Tn554 107-108 
Tn107-108 
“tee me Ff 4” (“transposon yeast”), Ty 因子 着 丝 粒 
紫 ( 色 ) 细 菌 (purple bacteria) ,a 分 枝 77-78 
自发 突变 (Spontaneous mutation ) ,模式 53-55 
自然 选择 Cnatural selection)16-19,131 
有 利 的 (advantageous) 17 
共 显 性 的 (codominant)18-19 
定义 (defined)17 
固定 概率 与 (fixation probability and)22-23 
固定 时 间 与 (fixation time and)23-24 
负 的 (negative) 17 
新 达尔 文 主义 (neo-Darwinism and) 26-27 
超 显 性 的 (overdominant)17,18-19 


as 一- 


正 的 (positive)17， 在 寻找 无 根 树 的 根 中 的 (in rooting unrooted trees)70- 


纯洁 化 (purifying)17 71,74-75 
自身 折 回 DNA ColdbackDNA ) 125-127 变形 距离 法 中 的 (in transformed distance method) 66 
“8 #, DNA” (“selfish DNA”)115-116,131 组 织 血 红 和 蛋白 溶 酶 原 激 活 剂 (tissue plasminogen activa- 
BA 3 4 (repressor )8 tor, TPA)93-94 
组 成 同化 (compositional assimilation) , {fi 3 A 45 115-116 最 大 简约 法 (maximum parsimony methods), 64, 67-69, 
组 蛋白 基因 (histone genes)8-9,87 79,82 

中 的 核 苷 酸 蔡 换 速 率 (rate of nucleotide substitutions) 用 于 人 与 猿 的 (for humans and apes)75-76 

42-44,46-47 FA + A 4824 & Cor marsupials) 80 

48 44 (module(s) 83,75 It Sh 


组 外 单位 Coutgroup), 另 见 系 统 树 


“和 光环 


缩写 词 和 种 名 索引 


AATAA 块 (AATAA box),， 见 多 聚 腺 苷 酸化 信号 

Acheta comzesticxs( 蝗 虫 )82 

Achole plasma laidlawii (Fé fib {§ JRE) 132 

Ach yrthosi phon magnoliae 4F #8 )82 

ACTH 基因 (ACTH gene) 44 

Actinobacteria iit & FA) »132 

Adh, 3 8? Whi A i 

Aedes (fF 8% J& 137-138 

Aegilops bicornis (VA ffi Li = FE ) 38-39 

Aegilops sharonensis (Vb & 1 FE ) 38-39 

AIDS (XG FH )58,108 

Allium cepa( 洋 葱 )，C 18126 

Alu F¥ i) CAlu sequences), 低 密度 脂 蛋 白 受 体 基 因 中 的 (in 
low-density-lipoprotein receptor gene)116 

Ammodramus maritimus (¥¢ WE € ) 80-81 

Amoeba dubia( Ket & I 8), C 18125 

Amoeba proteus(K 4 #), C 18125 

Am phiuma means ($48), C 18125 

Anthrobacter luteus 132 : 

Artemia salina(— # A #5 Bh 81-82 

BIR (B1 family)114, 5 W Alu 序列 

Bacillus brevis i ¥F Bi) 132 

B-# £4 {& (B-chromosomes) 129 

Bacillus subtilis i Ft FF 132 

Boa constrictor (#€) »C {4125 

Bombyx mori( RR # ) 82,128 

Bowman-Birk 型 蛋白 酶 抑制 因子 (Bowman-Birk type pro- 

tease inhibitor) ,内 部 域 重 复 86-87 

CAAT (CAAT box)7-8 

Carcarias obscurus &_) ,C {#125 

cDNA (4. #} DNA)60,105,107-109,111 

CDRs( 决 定 互补 性 的 区 域 )45-46 

Clostridium innocuum AK F 44 FF RZ —)132 

Clostridium pasteurianum (EF # 7a RA), A af dt me 
85-87 

Clostridium per fringens J" &\ 3 AB ) 132 

Coscinodiscus asterom phalus ( 5 Ht (Al Si BE . HEME) «C 18125 

cox | 3£ A (cox I gene) 97-98 

Cu/Zn 超 氧 化 物 岐 化 酶 基因 (Cu/Zn superoxide dismutase 

gene)112-113 

C 型 病毒 基因 (type-C virogene) ,水 平 转移 120-122 

C 值 (CC value(s)123, 另 见 基 因 组 大 小 细菌 (bacteria)123 
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HOKE W (eukaryotes) 124-127 
C {A t¥ i (C-value paradox )124-127,131 
Cyprinus car pio (##) 134-135 
C {8 (C values)125 
Dasyurus maculatus (FE FE 4S Wh) 80 
Dictyostelium discoideum (网 柱 菌 属 之 一 )137-138 
反 录 转 座 子 (retrotransposons)108-110 
Dipodomys ordii il fi —#P)125-127 
DNA 另 见 核 苷 酸 中 的 条 目 
互补 Ccomplementary), 见 cDNA 
双 链 的 (double-stranded)6-7,40 
自身 折 回 (foldback)125-127 
高 度 重 复 (highly repetitive)125-127 
废物 (junk)131 
中 度 重 复 (middle-repetitive)125-127,129-130 
线粒体 (mitochondrial)79-81 
非 基因 (Cnongenic)126-127,131 
核 类 型 的 (nucleotypic)131 
细胞 器 (organelle)52-54 
在 质粒 中 的 起 源 (originating in plasmids)123-124 
重复 (repetitive)126-129 
Ti # (satellite)127,129-130,131 
“8 #.” (“selfish”) 115-116,131 
*% #% Ml (single-copy) 126-129 
FA — (unique) 126-129 
DNA -DNA 4¢2€ (DNA-DNA hybridization) 37 , 39-40 
KX. 5548 Al (humans and apes and)40,76 
DNA & (DNA duplication) 114,116,127-128, 5 Wb & 
子 
DNA & & fi (DNA polymerase)14,131 
DNA #° 4% (DNA amplification) 79,130-131 
DNA 复制 (CDNA replication) 9-10,129 
DNA 修复 (CDNA repair)51-53,106-107,111 
DNA 序列 (CDNA sequence) 6 
KK FF RF M (nucleotide substitution ) 28-35 
PCR 扩 增 (PCR amplification )77-80 
4 AS HE RE (polymorphism measurement) 25-26 
限制 位 点 (restriction site) 37-39 
DNA 顺序 资料 CDNA sequence data) ,对 分 子 系统 发 育 的 
影响 60 
DNA 中 介 的 转 座 CDNA-mediated transposition) ) , 见 转 座 
Drosophila( R: #8) 129-130,137-138,15,101,113-114,128 


尸 因 子 在 物种 间 的 水 平 转移 (horizontal transfer of P el- 
ements between Species)121-122 
杂种 劣势 (hybrid dysgenesis) 116-118 
反 录 转 座 子 (retrotransposons)109-110 
Drosophila mauritania( F # — FH) 121-122 
Drosophila melanogaster (FR HB) 82, 106-107, 116-119, 121- 
122 
醇 脱 氢 酶 核 苷 酸 多 样 度 (Calcohol dehydrogenase nu- 
cleotide diversity)25-26 
变通 的 拼接 与 (alternative splicing and)97-98 
C 值 Cc value)125 
同 义 密码 子 的 非 随 机 应 用 Cnonrandom usage of synony- 
mous codons)56-57 
rRNA 基因 (rRNA genes)88 
Rsp 基因 座位 (Rsp locus)127-128 
可 转 座 因子 (transposable elements)105,107-108,119- 
120 
tRNA 基因 (tRNA genes)88 
Drosophila nasutoides ( 5 #8 JR — FP), i RE HS DNA127- 
128 
Drosophila saltans (5% #8 JR — FP) 121-122 
Drosophila sechellia (FR #8 J — FF) 121-122 
Drosophila simulans (5% #8 J — FP) 118-119,121-122 
Drosophila willistoni (5 #8 J — FP) 121-122 
Drosophila yakuba (FR #) 121-122 
Echymipera 80 
EGF (epidermal growth factor ,表皮 生长 因子 )93-94 
Erysiphe cichoracearum(— ## A) .C 18125 
Escherichia coli (XK Mi ¥¥  )37-39,59,76-77,123-124,132- 
133 
插 人 序列 (insertion sequences) 106-107 
同 义 密码 子 的 非 随 机 应 用 Cnonrandom usage of synony- 
mous codons)55-57 
rRNA 基因 (rRNA genes)88 
可 转 座 因子 (transposable elements)105-107,116 
Euplotes aedzczlatxs( 小 腔 游 仆 虫 属 )137-138 
GT-AG 规则 (GT-AG rule)8,90 
GC 含量 (GC content)57-58 
细菌 中 的 (in bacteria)131-134 
同 质 段 与 (isochores and)134-137 
GC 块 (GC box)7-8 
GC 突变 的 压力 (GC mutational pressure)132-133 
Gallus domzestiziczs( 鸡 ),C 值 125 
Gal ycine maz( 大 豆 )84-85 
Gorilla gortla( 大 猩猩 )72-76 
Haemophilus aegyptixs( 哮 血 杆 菌 属 之 一 )37-39 
Haemophilus zxuenzae( 流 感 嗜 血 杆 菌 )37-39 
Lactobacillus viridescens (F1, 1 FF A JZ — ) 132 
Lac Z 4 (A (Lac Z gene) 105-106 


Lam preta planeri(-E {§ #8), C {#125 
LDH， 见 乳酸 脱氧 酶 
Lilium formosanum (台湾 百合 ),C 值 125 
LINEs (long interspersed elements 的 首 字 母 缩 略 , 长 散在 
因子 )128-129 
Micrococcus Lutexs( 小 球菌 属 之 一 )132-133 
mRNA 
变通 的 拼接 与 (alternative splicing and)97 
编码 区 (coding regions)7-8 
M ycobacterium tuberculosis (4 %K FF fA ) 132-133 
M ycoplasma(#X J J 132 
M ycoplasma ca pricolum (fX Jip VE JR Z— 132-133 
M yxococcus xanthus fi ER A RZ) » IR EF 110 
Na, K-ATP fi B 3£ fA (Na, K-ATPase B gene) 44 
Navicula pelliculosa( ft Fe & J&Z — Ct $C 18125 
Neisseria cinerea ( Ae 3 KK FA RZ — 37-39 
Nicotiana tabacum (Kl # ) 
叶绿体 基因 组 (chloroplast genome) 52 
C 值 (C values)125-126 
Nocardia otitidis-caviarum i F K AJR Z — ) 37-39 
Ophioglossum petiolatum(— # RE) »C {4125 
ORFs, WH i€ te 
OTUs, 见 操 作 中 的 分 类 单位 
Oxytricha xzov&( 尖 毛虫 属 之 一 )137-138 
Pan paniscus 3& 38 FH 40 
Pan troglod ytes (3 92 )72-76 
Papio anubis U5 Bi Bb) 57-58 
Papio cynoce phalus Pe Bi Z — FP) 121-122 
Papio hamadr yas GR & Be Be) 121-122 
Papio papio Hp # ) 121-122 
Paramecium aurelia( 3K & i Bh) .C (4124-126 
Paramecium caudatum (Fe & J 4), C {4124-126 
Parascaris equorum (4 #3|) »C {2125-126 
PCR , 见 多 聚 酶 链 式 反应 
PGK 多 家 族 ( 磷 酸 甘 油 酸 激酶 多 家 族 )111,112 
Phalanger 80 
Phaseolus vulgaris (3% FZ )84-85 
Philander opossum andersoni RK #k fi FR.) 80 
Philosamia cynthia ricini(— #P #R) 82 
Physarum polycephalum (9X 38 FA J&Z —)137-138 
Pinus resinosa(¥ ) ,C {8125 
P-M 系统 (P-M system), 116-118 
Pongo pygmaeus ( 4 BE) 
Proteus vulgaris ¥% ii 48 ¥F A) 132-133 
Protopterus aethiopicus (iii £4) »C 18125 
Pseudomonas fluorescens Fe He {BF fd FA) 125 
P AF (P elements) 105-106, 107-108,116-119, 5 WL a #% 
座 因子 
果 蝇 种 间 的 水 平 转移 (horizontal transfer between 
“ee 


Drosophila specles)121-122 
RNA 
信使 (messenger) , 见 mRNA 
转录 后 的 修饰 (modification following transcription ) 9- 
10,111 
前 信使 (pre-messenger) , 见 前 -mRNA 
核糖 体 的 (ribosomal) , 见 rRNA 
小 核 的 (small nuclear) , 见 snRNA 
转录 的 (transcribed ) ,7-8 
转移 (transfer), WL tRNA 
RNA & & fi (RNA polymerase) ,7-8 
RNA & & Bf 1 ,7 
协同 进化 与 (concerted evolution and)102 
RNA 序列 CRNA sequences)6-7 
RNA & & fi I 7-8 
RNA #74) & 4 B (RNA-mediated transposition), 5 
转 座 
RNA 转录 本 (RNA transcript) 
变通 的 拼接 (alternative splicing)97 
反 录 序列 与 Cretrosequences and)109-110 
RNA-DNA 杂交 (RNA-DNA hybridization) 
rRNA 基因 (rRNA genes)81-82,87-88,101-102,123,130 
叶绿体 中 的 (in chloroplasts)52 
协同 进化 与 (concerted evolution and)98-99 
内 共生 学 说 与 (endosymbiotic theory and)77-78 
外 部 可 转录 间隔 (external transcribed spacer)99-100 
内 部 可 转录 间隔 (internal transcribed spacer)99-100 
哺乳 动物 线粒体 中 的 (in mammalian mitochondria)52 
不 转录 间隔 (Cnontranscribed spacer)99-100 
植物 线粒体 中 的 (in plant mitochondria)52 
转录 (transcription)7,99 
不 等 价 交 换 (Cunequal crossing-over)100-101 
Rs 基因 座位 CRsza locus), 见 应 答 者 基因 座位 
Rattus norvegicus (#4 HR FR) .C 值 125 
Saccharomyces cerevisiae (BB 15 W & 124-125 
同 义 密 码 子 的 非 随 机 应 用 Cnonrandom usage of synony- 
mous codons)55-57 
rRNA 基因 (rRNA genes)88 
可 转 座 因子 (transposable elements)116 
Salmonella typhimurium ( fi (5 % VW 1) FR A) 119-120 
Sarcophilus harrisii (48 3€ )80 
Schistocerca gregaria( 44% #1) ,.C (#125 
scRNA 基因 (scRNA genes) ,转录 7 
Shigella dysenteria( Hil Fe EH EK BA ) » 8 A FR 106-107 
SINEs (short interspersed elements 的 首 字 母 缩 略 , 短 散 在 
因子 )128-129 
snRNA 基因 (snRNA gene) ,转录 7-8 
Staphylococcus atrexs( 金 黄色 酿 浓 葡萄 球菌 )107,132 
Streptococcus faecals( 粪 链球 菌 )132 
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Streptomyces griseus $# 3% A J&Z — )132 
Strong ylocentrotus (ER ¥8 AA J&R ) 137-138 
TACTAAC & (TACTAAC box) 9-10 
TATA (TATA box)7-8,90 
Tetrahymena (VU fi 8 J) 10 
Theropithecus gelada( it Fe 9 — FP) 121-122 
Thy-1tit AC(Thy-1 antigen) 50 
Thylacinus cynoce phalus (48 Ft ) 80 
Trichosurus (a FE 4 58 JB) 80 
tRNA 9-10 
丰 度 与 同 义 密码 子 的 非 随 机 应 用 (Cabundance and non- 
random usage of synonymous codons)55-57 
来 自 一 的 加 工 后 假 基因 (processed pseudogenes derived 
from)112-113 
tRNA 基因 (tRNA genes) ,9-10,87-88,95-96,123-124 
叶绿体 中 的 (in chloroplasts)52 
哺乳 动物 线粒体 中 的 (in mammalian mitochondria)52 
植物 线粒体 中 的 (in plant mitochondria)52 
转录 (transcription )7 
Trypanosoma brucei (Ap FR #é PE 128 
Ty AF (Ty elements)116 
U6 A (U6 gene) ,转录 7-8 
Vicia faba( # @)84-85 
Xenopus (J 8 114 
协同 进化 (concerted evolution) 98-99 
Xenopus borealis M ¥8 Z — ) 98-99 
Xenopus laevis NW Z — )98-99, 134-135 
C {fi (c values) 125 
rRNA 基因 (rRNA genes) 88 
Xenopus mulleri MM 8 Z— )98-99 
Zea mays( XK )77-78 
a-ff 4 A 4E A (a-fetoprotein gene) 48a 微 管 蛋白 (Ca 
tubulin) 44 
a- fii BF Bit (a-enolase) MVE -磷酸 丙酮 酸 水 合 酶 ,98-99 
ao- 珠 蛋 白 基 因 (a-globin gene)84-85,88,91,103,113,134- 
137 
al 92-93 
a2 92-93 
密码 子 应 用 模式 (codon-usage patterns) 57-59 
家 族 (family ) 92-93 
中 的 核 苷 酸 蔡 换 速率 (rates of nucleotide substitution 
in)43,44,49 
al- 抗 胰 和 蛋白 酶 (al-antitrypsin)50-51 
BY — de FP Pe HK i. CHE ) (8* 一 thalassemia)97-98 
B- kt fF 3 A EA (B-tubulin gene) 113 
B- 珠 蛋白 基因 (B-globin gene) 84-85, 88, 91-93, 102-103, 
134,136-137 
密码 子 应 用 模式 (codon-usage patterns)57-59 
家 族 (family)92-93 


中 的 核 苷 酸 蔡 换 速率 (rates of nucleotide substitution 5- 珠 蛋白 基因 (5-globin gene)92-93 


in)43,44-45,47,49,50-51 b1- 珠 蛋白 基因 (61-globin gene)58-59, 92-93 
7- 珠 蛋白 基因 (7-globin gene)44-45,92-93,100 


6- 珠 蛋 白 基 因 (6-globin gene)50-51,92-93,102-103 
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分 子 变 异 与 生态 学 问题 


1 4 a 


分 子 遗传 学 的 新 进展 为 生态 学 提供 了 许多 新 的 并 且 具 有 很 高 价值 的 技术 。 就 象 这 些 技 术 似 乎 是 
解决 生态 遗传 学 和 进化 生态 学 问题 的 基础 一 样 ， 它 们 也 开始 为 其 他 生态 学 领域 提供 了 有 用 的 研究 工 
具 。 现 在 有 一 种 倾向 , 批评 许多 生态 学 家 喜好 和 应 用 这 些 新 技术 是 一 种 潮流 ,或 可 能 是 生态 学 中 的 最 
it “AY fe” (Abrahamson 等 1989) ,但 我 们 认为 这 是 生态 学 家 们 的 积极 响应 ,因为 这 种 新 的 可 能 性 实际 
上 会 引发 一 次 关键 性 的 技术 飞 跃 。 

这 些 技术 直接 的 重要 作用 是 有 效 地 检测 生物 个 体 间 的 差别 DNA. 组 成 所 有 DNA 分 子 的 四 种 核 
苷 酸 的 显然 很 简单 的 线性 排列 与 表现 在 以 下 几 个 方面 巨大 而 复杂 的 异 质 性 是 很 不 相符 合 的 ,这 些 方 
面包 括 进化 速率 、 差 异 很 大 的 序列 结构 、 突 变速 率 ` 固 定 速率 以 及 选择 压力 等 (图 1).。 许 多 生物 体 的 一 
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图 1 DNA 序列 进化 的 相对 速率 
些 基 因 组 具有 不 同 的 遗传 方式 和 序列 进化 率 ( 见 图 2) ,对 于 它们 的 比较 可 以 得 到 有 价值 的 认识 。 另 . 
外 ,可 用 的 各 种 分 子 技 术 本 身 提 供 了 不 同 的 敏感 程度 。 这 样 就 使 从 近 缘 的 各 种 个 体 到 在 古代 就 已 趋 
异 的 物种 之 间 的 每 一 种 亲缘 关系 程度 , 最近 已 可 能 在 目标 DNA 分 级 与 适合 作 定量 遗传 差异 (或 相 
似 ) 的 分 子 方法 间 选 择 到 一 种 结合 。 
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图 2 不 同类 群 中 可 用 作 分 析 的 基因 组 

长 期 以 来 ,对 表 型 变异 与 保持 感 兴趣 的 生态 学 家 们 ,通过 分 离 等 位 变异 涉及 表 型 的 基因 ,能 够 直 
接 分 离 和 研究 其 遗传 构成 。 这 将 与 在 商业 上 具 重 要 价值 的 动 . 植 物 物种 早已 开展 分 子 遗 传 研究 一 样 ， 
是 一 种 自然 的 进步。 

在 这 个 综述 中 ,我 们 主要 集中 于 DNA 变异 的 分 析 , 而 不 是 特异 序列 功能 或 特定 位 点 选择 过 程 的 
研究 。 我 们 通过 有 关 生 态 学 问题 的 实例 来 曾 明 其 应 用 的 范围 。 附 表 中 ,我们 总 结 了 迄今 为 止 运用 各 种 
分 子 方法 解决 的 生态 学 问题 。 我 们 顺序 介绍 其 应 用 领域 ,并 努力 强调 在 每 个 领域 中 ,现在 看 来 最 合适 
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的 方法 。 由 于 大 多 数 的 技术 可 用 于 处 理 种 种 问题 ,为 避免 重复 ,首先 我 们 来 简单 描述 一 下 主要 的 新 技 
术 。 


2 技术 与 术语 


这 一 节 论 述 了 所 用 到 的 不 同 技术 的 一 个 概貌 。 与 生态 学 家 的 需要 特别 有 关 的 两 本 手册 分 别 是 由 
Heolzel(1992) 和 Hillis 与 Moritz(1990) 编 著 的 。 本 章 所 描述 的 已 建立 的 主要 方法 在 上 述 两 本 书 上 有 详 
AM BGR AEE; 其 它 的 文献 在 需要 的 地 方 给 出 。 


2.1 材料 来 源 


实际 上 ,任何 细胞 组 织 都 是 合适 的 DNA 来 源 。 在 肴 椎 动物 研究 中 ,因为 血液 的 获得 是 非 破 坏 性 
的 ,所 以 是 最 常用 的 材料 。DNA 所 需 的 量 依 所 用 的 技术 的 不 同 而 不 同 。 例 如 ,对 于 以 DNA 一 DNA 杂 
交 为 基础 的 方法 ,如 多 位 点 DNA 指纹 ,每 次 样品 操作 需要 5ugDNA( 一 般 这 个 量 足 够 以 进行 若干 次 
操作 ) 。 材 料 从 鸟 类 的 血液 ( 它 的 红细胞 是 具 核 的 ) 中 获得 只 需 1 一 2ul, 对 于 哺乳 动物 来 讲 , 只 有 白细胞 
具 核 , 则 需要 lml 血液 .对 于 应 用 扩 增 技术 的 方法 来 讲 , 如 聚合 酶 链 式 反应 (PCR) ,虽然 由 于 存在 潜在 
的 污染 问题 ,通常 都 避免 这 么 小 的 取样 ,但 是 在 理想 条 件 下 ,开始 于 一 单 倍 体 基 因 组 (haploid genome) 
的 分 析 是 可 行 的 。 

尽管 多 数 实 验 室 一 直 都 是 采用 冷冻 的 方法 保存 用 于 提取 DNA 的 组 织 , 但 已 经 证 明 各 种 化 学 混 
合剂 (包括 促 溶 剂 , 丈 合 剂 ,乙醇 和 浓 盐 溶液 ) 能 够 在 环境 温度 下 保存 适用 于 大 多 数 分 析 方 法 的 相对 较 
长 的 DNA 分 子 至 少 几 周 或 几 月 ( 见 Bruford 等 ,1992)。 例 如 ,从 酒精 中 保存 6 年 之 久 的 动物 组 织 中 
提取 出 大 量 可 被 限制 性 核酸 内 切 酶 切断 的 DNA(Smith 等 1987) 。 但 是 另外 的 研究 则 报道 了 低 的 产 
量 和 快速 降解 (Seutin 等 ,1990) 。 不 同 之 处 可 能 是 由 于 商业 酒精 的 污染 (lto,1992) 。 


2.2 DNA—DNA 杂交 
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的 简单 方法 是 点 印迹 (dot blot)， 即 在 与 标记 了 的 探 针 杂交 前 ,将 等 分 试 样 的 DNA( 甚 至 血液 ) 点 到 滤 
膜 上 并 固定 。 探 针 最 常用 的 是 放射 性 标记 了 的 ,但 是 非 放射 性 标记 的 方法 逐渐 发 展 并 普遍 起 来 。 通 过 
各 种 合适 的 对 照 来 比较 其 杂交 强度 可 以 测定 目标 样品 中 探 针 序列 的 存在 。 杂 交 的 检测 可 以 通过 和 射 
线 放射 自 显影 或 直接 在 膜 上 探 针 的 化 学 染色 。 当 研究 一 特异 性 序列 时 , 探 针 可 以 是 一 克隆 了 的 DNA 
片段 或 一 非常 短 的 ,典型 的 是 20 一 30 个 碱 基 对 ,人 工 合成 的 守 核 苷 酸 序列 。 一旦 一 个 克隆 被 测序 后 ， 
就 可 以 设计 寡 核 苷 酸 探 针 , 并 且 原 则 上 人 允许 相对 快速 而 方便 地 对 序列 变异 数据 的 收集 (如 Gardes 等 
1991). 


2.3 限制 性 片段 分 析 


用 点 印迹 法 简单 地 检测 相似 序列 经 常 是 不 够 的 , 我 们 需要 更 详细 的 有 关 杂 交 的 目标 DNA 的 信 
息 。 直 到 最 近 , 估 测 DNA 序列 变异 的 最 简单 方法 是 应 用 限制 性 片段 (或 限制 性 片段 长 度 多 态 性 ， 
RFLP) 来 分 析 。 首 先 ,样品 DNA 被 许多 合用 的 限制 性 内 切 酶 之 一 种 切 成 一 定 的 片段 ， 然 后 依 它们 的 
长 度 将 这 些 片段 通过 电泳 分 离 。 限 制 性 片段 可 以 通过 电泳 凝 胶片 的 染色 观察 或 如 上 所 述 , 按 South- 
ern 印迹 法 永久 地 转移 到 一 个 滤 膜 上 经 过 杂交 检测 。( 现在 有 些 方法 为 了 避免 印迹 这 一 步 , 而 是 把 片 
段 在 凝 胶 上 于 燥 后 直接 杂交 凝 胶 , 如 Schafer 等 1988)。DNA 片段 的 存在 与 否 暗示 着 应 用 特定 限制 性 
内 切 酶 来 识别 的 特异 性 目标 序列 的 变异 。 


2.4 DNA 指纹 分 析 


有 两 种 不 同 级 别 的 DNA 指纹 分 析 一 二 多 位 点 和 单位 点 指纹 。 对 于 后 者 ,通过 与 一 克隆 的 小 卫星 
探 针 的 Southern 印迹 杂交 ,可 以 检测 在 一 个 单位 点 上 等 位 DNA 限制 性 片段 的 不 同 大 小 (Wong 等 
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1987) 。 一 个 典型 的 小 卫星 DNA 序列 的 长 度 大 于 20,000 个 碱 基 对 , 它 包 括 一 个 短 的 10 一 60 碱 基 对 
的 非 编 码 序 列 的 重复 拷贝 。 重 复 的 次 数 有 显著 的 差异 ,可 以 产生 易于 检测 的 不 同 长 度 的 限制 性 片段 ， 
从 而 在 一 些小 卫星 位 点 得 到 了 很 高 水 平 的 多 态 性 ( 杂 合 率 达 100%%)。 小 卫星 位 点 是 “可 变数 量 的 串联 
重复 (VNTR) ”位 点 的 例子 。 

在 多 位 点 DNA 指纹 法 中 ,用 到 了 一 个 “多 核心 (poly-core)” 探 针 ， 它 可 与 部 分 重复 单位 ( 即 “ 核 
>”) BARS, 这 种 重复 单位 在 微 卫 星 的 很 多 分 离 的 位 点 上 是 很 普通 的 (Jeffrey 等 ,1985a,b)。 可 以 
用 不 同 的 核心 探 针 来 检测 非 依赖 性 小 卫星 带 谱 (Kindependent minisatellite profiles) 。 多 位 点 指纹 法 的 
一 个 主要 优点 是 核心 探 针 可 用 在 广泛 的 生物 体 中 (如 Burke 和 Bruford 1987, Dallas 1988,Taggart 和 
Ferguson 1990,Carvalho 等 1991; 见 Burke 等 1991a 综述 )。 有 关 多 位 点 和 单位 点 小 卫星 DNA 指纹 法 
的 详细 实验 室 操作 程序 见 Bruford 等 (1992) 的 文章 。 

多 位 点 指纹 法 的 一 个 缺点 是 指纹 谱 复 杂 ,难以 比较 ,特别 是 在 不 同 的 凝 胶 上 得 到 的 谱 。 组 成 的 
DNA 片段 也 不 能 归 因 于 特异 性 位 点 。 单 位 点 指纹 法 通过 允许 基因 型 归 因 于 常常 是 高 度 变 异 的 位 点 避 
免 了 这 些 问 题 , 但 它 也 有 缺点 ,就 是 在 所 研究 的 每 一 个 物种 中 或 至 少 在 一 个 近 缘 种 中 都 得 找 出 一 种 
标记 系统 (Hanotte 等 ,199la,b,1992)。 然 而 ， 现 在 可 以 使 用 一 种 相对 有 效 的 分 离 这 种 位 点 的 方法 
(Armour 等 1990,Hanotte 等 199la,b;Bruford 等 (1992) 的 操作 程序 ) 。 

另外 一 种 级 别 的 VNTR 位 点 包括 了 简单 的 序列 ,或 微 卫 星 多 态 性 (Tautz1989) 。 微 卫星 (micro- 
satellite) 包 含 不 同 数量 简单 而 短 的 串联 重复 ,如 (GT)n 或 (CAC)n。 小 卫星 和 微 卫 星 的 区 别 是 随意 的 ， 
但 实际 的 区 别 是 微 卫 星 总 的 长 度 小 到 允许 应 用 PCR 技术 分 析 。 所 以 微 卫 星 的 变异 分 析 比 小 卫星 容易 
得 多 ( 见 Rassmann 等 1991,Schiotterer 等 (1991) 的 方法 )。 特 异 位 点 微 卫星 系统 常 在 宽 范 围 的 近 缘 种 
中 适用 (Schlotterer 等 ,1991), 在 一 定 程 度 上 比 小 卫星 探 针 更 有 用 。 由 于 这 里 数据 太 少 而 不 能 在 两 个 
级 别 的 两 个 位 点 进行 典型 变异 的 细致 比较 。 高 水 平 的 多 态 性 很 可 能 在 小 卫星 位 点 上 得 到 , 但 微 卫 星 
的 变异 似乎 适合 作 大 量 的 应 用 。 


2.5 DNA 放大 


* 


一 个 相对 较 新 的 方法 应 用 于 大 多 数 DNA 样品 中 一 一 包括 相当 粗 提 的 总 DNA 一 一 这 个 方法 是 
聚合 酶 链 式 反 应 (PCR) (Mullis 和 Faloona, Saiki 等 1988)。 这 种 技术 可 以 产生 足 量 的 确定 长 度 的 
DNA ,适合 各 种 方法 的 进一步 分 析 , 如 RFLP 测序 和 与 特异 探 针 的 杂交 。 在 聚合 酶 链 式 反 应 中 ,应 用 
二 耐 高 温 的 DNA 聚合 酶 循环 复制 相反 的 两 条 DNA 链 上 两 个 引物 部 位 之 间 的 序列 , 这 个 反应 需要 
ATARHEBARIIDHEES DNA 上 的 这 些 部 位 互补 ,每 循环 一 次 ,产量 成 倍增 加 。 这 个 过 程 
的 灵敏 度 使 得 它 可 以 对 极 少量 DNA 进行 分 析 , 例 如 这 些 DNA 可 来 自 单个 精子 细胞 (Amheim 等 
1990) , 单 根 头 发 (Higuchi 等 ,1988) ,单个 羽毛 (Taberlet 和 Bouvet, 1991), Hh {0 HY & AK CHagelber, 
1989) 或 博物 馆 中 的 标本 (Thomas 等 ,1989,1990) 。 由 于 所 研究 的 序列 只 需要 很 少 的 完整 拷贝 ， 甚 至 
固定 的 或 包 埋 了 的 组 织 都 适合 来 提取 DNA 作 PCR(Greer 等 1991) ,所 以 ,很 简单 的 野外 样品 保存 和 
实验 室 提 取 的 操作 程序 都 会 令 人 满意 。 

因为 扩 增 的 PCR 产品 有 足够 的 量 可 供 直接 在 电泳 凝 胶片 上 检测 ,所 以 PCR 为 杂交 方法 提供 了 
另 一 个 很 好 的 选择 。 例 如 可 以 检测 引物 部 位 间 的 序列 长 度 变异 或 检测 在 一 个 引物 部 位 本 身 的 变异 。 
PCR 产物 可 以 用 作 点 印迹 DNA 一 DNA 杂交 时 的 靶 材 料 , 也 可 用 作 限 制 性 分 析 。 它 们 和 其 它 技术 (下 
文 ) 可 以 不 需要 广泛 地 测序 就 可 以 相对 方便 地 收集 有 用 的 基于 序列 的 标记 数据 。 


2.6 DNA 测序 


直到 最 近 ,得 到 一 个 序列 之 前 , 必须 先 从 所 研究 的 生物 体 中 克隆 一 个 序列 。 比 如 对 整个 基因 的 
DNA 多 态 性 的 研究 ， 需 要 分 别 地 从 每 个 个 体 克 隆基 因 〈 如 Kreitman 1983)。 一 且 一 特定 位 点 至 少 
在 一 个 亲缘 生物 体 中 得 到 克隆 并 测 得 序列 (由 此 可 设计 出 寡 核 苷 酸 引物 ),PCR 的 优点 是 通常 可 以 绕 
过 克隆 这 一 步 。 对 一 些 位 点 来 说 ,可 以 鉴定 两 侧 的 序列 段 (stretches of flanking sequence) ,它们 在 一 广 
阔 范 围 的 类 群 中 是 高 度 保守 的 ,人 允许 设计 “通用 ”的 引物 (Kocher 等 1989,Hillis 和 Dixon 1991 ,Tabeer- 
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let 等 1991) 。 现 在 已 经 有 了 直接 对 PCR 产物 测序 的 很 好 的 操作 程序 (如 Winship 1989 ,Innis 1990, 
Lee 1991) 。 一 些 工作 者 喜欢 在 测序 前 亚 克 隆 PCR 产物 ,但 是 这 就 意味 着 ,特别 是 当 多 序列 需要 排除 
人 工 核 苷 酸 替 换 的 可 能 时 ,可 能 造成 相当 大 的 额外 工作 量 。 


2.7 变性 梯度 凝 胶 电 泳 


既 便 通 过 PCR 和 直接 测序 可 以 相对 比较 容易 地 获得 序列 数据 , 但 是 要 积累 起 适合 作 核 基因 等 
位 基因 或 线粒体 单 膜 类 型 (haplotypes) 比 较 的 种 群 频率 数据 ,是 一 个 令 人 胆 尾 的 任务 。 虽 然 除 医学 遗 
传 学 外 ,变性 梯度 凝 胶 电 泳 (DGGE) 尚未 被 广泛 应 用 ,DGGE 及 其 相近 的 方法 (如 温度 梯度 凝 胶 电 泳 
(TGGE) (Riesner 等 1989) 和 PCR 一 单 链 构象 多 态 性 (SSCP) 分 析 (Hayashi 1991)) 能 够 提供 用 来 测序 
数 十 个 样品 的 较 低 劳动 强度 的 方法 。Lessa(1992) 和 Myers 等 (1989) 提 供 了 DGGE 方法 详细 的 指导 ， 
但 是 ,简单 地 说 ,这 种 方法 需要 为 所 研究 的 具有 长 G-C 尾 的 区 域 准 备 一 个 引物 .这 种 具有 抗 变性 的 G- 
C 键 的 扩 增 产物 可 在 含有 脲 的 梯度 凝 胶 上 电泳 .不 同 序列 的 产物 在 不 同 的 腺 浓度 上 部 分 地 变性 ,对 长 
度 小 于 500bp 的 产物 ,小 到 只 有 1 个 碱 基 对 替换 的 变化 能 够 通过 移动 距 离 的 不 同 而 分 辨 出 来 .频率 数 
据 ( 包 括 杂 合子 的 辨别 ) 可 直接 由 凝 胶 上 得 到 .如果 有 要 求 的 话 ,代表 已 检测 了 迁移 等 级 的 谱 带 上 的 样 
品 可 以 被 再 放大 并 测序 。 在 这 种 应 用 中 , DGGE 对 研究 DNA 片段 在 种 群 内 或 其 它 研究 单位 内 的 中 等 
变异 是 最 有 用 的 (就 是 说 ,不 是 所 有 的 个 体 都 是 独特 的 ) 。 然 而 ,这 对 从 种 群 遗 传 或 系统 发 育 角 度 作 初 
步 探索 可 能 有 同等 的 价值 , 即 在 被 选择 的 各 种 个 体 的 DNA 片段 测序 前 ,在 种 群 或 分 类 群 内 或 之 间 去 
评估 最 初 放 大 的 DNA 片段 是 否 有 一 定 程 度 的 变异 。 


2.8 随机 放大 多 态 性 DNA 


人 们 现在 广泛 地 探索 随机 放大 多 态 性 DNA(CRAPD)， 部 分 是 由 于 它 显 著 的 简单 性 。 它 依赖 由 被 
研究 的 生物 体 中 提取 的 DNA( 有 时 来 自分 离 的 细胞 器 中 )， 应 用 几 组 短 的 单 链 随 机 序列 引物 来 测定 
变异 (Williams 等 1990; Hardrys 等 1992) 。 经 过 琼脂 糖 电 泳 和 省 化 乙 锭 染色 后 ,比较 放大 产物 时 ,一 
些 引物 将 产生 少许 分 离 的 带 , 它 们 的 一 部 分 在 种 群 内 或 种 群 间 是 多 态 的 。 当 检测 时 ， 这 些 标记 通常 呈 
现 显 著 的 孟 德 尔 遗 传 特性 (Williams 等 1990，Arnold 等 1991) 。 在 动 植物 中 ,这 些 标记 可 用 来 制作 基 
因 连 锁 图 (Williams 等 1990) 。 

假设 不 了 解 被 放大 的 区 域 ,并 且 有 关 的 书面 出 版 物 很 少 ， 对 于 每 一 种 新 的 生物 必须 检验 从 不 同 
个 体 中 多 次 分 别提 取 和 放大 ( 若 有 可 能 也 包括 遗传 力 ) 的 产物 模式 的 重复 能 力 。 应 用 得 好 ,这 种 方法 
仅 需 要 DNA 分 离 、 放 大 和 琼脂 糖 凝 胶 电泳 过 程 , 就 可 提供 丰富 的 多 态 性 标记 数据 。 避 免 了 限制 性 酶 
和 放射 性 标记 的 高 消耗 和 复杂 性 。 


在 这 一 部 分 ,我 们 讨论 生态 学 家 感 兴趣 的 领域 .所 研究 不 同 范畴 的 问题 及 用 到 的 方法 的 实例 列 在 
附 表 中 。 我 们 试 着 尽 可 能 地 选择 与 生态 学 家 有 关系 的 实例 并 尽 可 能 包括 有 代表 性 的 分 类 群 。 在 很 多 
情况 下 ,虽然 一 个 新 而 有 前 途 的 技术 建立 了 ,但 仍 没 有 正式 发 表 的 应 用 实例 ,反映 了 这 一 领域 中 技术 
发 展 的 步伐 还 不 快 。 阅 读 附 表 时 ,应 注意 这 种 可 能 性 。 就 象 在 附 表 中 所 列 的 一 样 ,读者 必须 明白 所 选 
的 一 些 实例 并 不 代表 最 有 效 的 方法 。 


3.1 性 别 鉴 定 


Fisher(1930) 预 言 , 在 有 性 的 物种 中 ,一 种 亲本 应 该 在 它 的 每 一 性 别 的 后 代 中 有 均等 的 总 投入 。 
Trivers 和 Willard (1973) 争辩 说 , 当 亲 本 的 投入 影响 到 一 个 后 代 以 后 的 生殖 成 功 (reproductive 
success) 并 且 在 生殖 成 功 中 某 一 性 别 的 变异 较 大 时 ,那么 一 种 亲本 应 该 在 这 种 性 别 有 较 大 的 投入 。 对 
于 许多 通常 的 生物 体 研 究 对 象 来 说 ,由 于 难于 在 幼年 期 作 性 别 鉴 定 (sexing juveniles), Aix Mae 
的 试验 、 相 关 的 假设 以 及 一 般 性 的 生活 史 的 研究 受到 了 障碍 。 有 一 个 在 形态 上 可 区 别 性 别 的 例子 , 东 
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部 蓝 色 鸣 鸟 (Szalia szalzs) 的 雄性 亲本 在 它们 的 肉 性 后 代 中 有 较 多 的 投入 (Gowaty 和 Drage 1991)。 有 
人 认为 ,这 个 物种 从 出 生 到 繁殖 扩散 之 所 以 很 低 是 因为 嗜 杀 父 (Phiopatric) 的 雄性 乌 可 以 为 了 雌性 而 
要 与 它 的 亲生 父亲 竞争 ,所 以 肉 性 后 代 将 占 雄 性 适合 度 较 大 的 比例 。 

性 别 是 由 遗传 决定 的 关键 是 至 少 在 一 种 性 别 的 本 身 具 某 些 特 异性 DNA。 原 则 上 这 种 情况 只 需 一 
个 位 点 的 等 位 基因 的 差异 ,而 实际 上 差异 一 般 广 泛 得 多 ,常常 包括 了 具 性 别 特异 的 染色 体 。 在 这 些 情 
况 下 细胞 学 的 性 别 鉴定 是 可 行 的 ,但 通常 要 求 作 大 样品 是 不 切实 际 的 ( 见 Parker 等 1991)。 用 分 子 标 
记 去 鉴别 特殊 的 性 染色 体 的 序列 特征 ,已 有 了 一 些 实例 。 例如 ,Griffiths 和 Holland(1990) 使 用 一 种 减 
法 克隆 (subtraction cloning) 技术 分 离 了 食 鲁 鱼 鸥 (Larzs argentatus) 1) W 染色 体 ( 肉 性 特异 的 ) 的 特 
异性 探 针 。 遗 憾 的 是 ,就 象 其 它 类 似 的 探 针 一 样 ,这 个 探 针 只 对 很 少 一 些 近 缘 种 有 应 用 价值 。 也 偶尔 
地 发 现 了 对 其 它 一些 物 种 的 伴 性 探 针 (如 Quinn 等 1990,Rabenold 等 ,1991) 。 

长 期 以 来 ,鉴定 和 分 析 性 别 决定 基因 本 身 似乎 避免 了 这 个 问题 .最 近 分 离 了 在 了 一 染色 体 上 的 性 
别 决 定 区 (CSRY) 的 基因 ,并 认为 它 对 人 类 来 说 是 性 别 决定 位 点 (Sinclair 等 1990, Gubbay 1990). 
它 能 够 作为 一 个 探 针 用 印迹 分 析 来 确定 一 系列 哺乳 动物 的 性 别 (Sinclair 等 1990). BRIER E FF HE BH 
物 分 类 群 中 , 它 好 象 可 能 具有 一 个 相同 功能 的 同 源 物 , 但 首次 在 鸟 类 寻找 这 样 一 个 同 源 基 因 并 不 成 
功 (CGriffiths 1991) 。 一 有 旦 得 到 了 合适 的 序列 数据 , 至 少 就 可 以 设计 和 合成 在 大 范围 的 哺乳 动物 物种 
中 有 用 的 寡 核 背 酸 探 针 ,或 至 少 可 以 设计 窒 核 苷 酸 引物 应 用 于 PCR 。 


3.2 交配 制度 


进化 生态 学 家 对 交配 制度 特别 感 兴趣 ,他 们 希望 能 够 度量 个 体 在 自然 条 件 下 的 生殖 成 功 情况 。 或 
者 ,也 需要 测量 互助 个 体 间 的 亲缘 关系 。 在 实践 中 , 父 本 和 母 本 的 检验 是 测量 亲缘 关系 的 一 种 特殊 情 
况 ( 如 Birkhead 等 1990) 。 为 这 个 目的 ,应 用 分 子 方法 一 一 特别 是 多 位 点 DNA 指纹 和 随机 RFLP 分 
析 一 一 进行 研究 ,可见 Burke 1989 WR. RI ,单位 点 指纹 分 析 发 展 迅 速 , 现在 已 成 为 可 选用 的 方 
法 (Burke 等 1991b) 。 

多 位 点 分 析 已 应 用 于 一 些 完 全 在 野外 进行 的 繁殖 系统 研究 上 ,现在 几乎 已 经 成 为 常规 方法 。 迄 
今 多 数 的 研究 集中 在 鸟 类 上 , 反映 了 鸟 类 作为 行为 生态 学 研究 对 象 的 普遍 性 , 并且 涉及 到 基本 上 是 
单 配 制度 中 确定 是 父 性 或 是 母性 ( 见 Burke 等 1991b ,Birkhead 和 Moller 1992) 或 者 关注 互助 繁殖 群 
成 员 之 间 的 血统 分 布 以 及 亲缘 关系 的 程度 ( Burke 等 1989，Rabenold 等 1990 ,Jones 等 1991, Pacher 
等 1991，Davies 等 1992) 。 

第 一 类 研究 范畴 是 关于 交 苦 交配 对 策 (alternative mating strategies) 的 发 生 , 例 如 ,用 排除 分 析 
(exclusion analyses) 发 现 子 代 基 因 型 与 它们 的 推断 亲本 不 一 致 ,以 此 来 检测 额外 配对 (extra- pair) 交 
配 或 种 内 繁殖 寄生 现象 (brood parasitism ) 。 例 如 , FE A fal FEI MT HEAL NG & (Taeniopygia guttata) 的 交 
配 行为 的 研究 导致 期 望 额外 配对 的 父 本 可 以 在 自然 种 群 中 出 现 . 在 对 一 野外 种 群 指纹 的 推断 研究 中 ， 
由 行为 指定 (behaviourally-assigned) 的 双亲 本 是 完全 的 ,并 且 经 过 排除 分 析 , 确 认 额 外 配对 的 父 本 以 
较 低 的 频率 发 生 (82 个 后 代 中 有 2 个 ) ， 而 种 内 繁殖 寄生 现象 则 意外 地 较 显 著 〈 80 个 后 代 中 有 9 
4+) (Birkhead 等 1990) 。 

例如 , E—-P ADEA RKRAW HRP. KA MAB (Prunella modularis) — RH ZB tt Si 
繁殖 ,2 个 或 更 多 的 雄性 共同 拥有 一 个 峻 性 。 这 些 雄 性 一 般 互 相 没 有 亲缘 关系 ,但 有 一 种 显 性 的 关系 ， 
可 能 其 中 一 个 或 两 个 雄性 一 起 去 帮助 雌性 喂养 雏 鸟 .虽然 这 些 雄 性 对 它们 的 后 代 没 有 明显 的 偏爱 ,但 
应 用 多 位 点 指纹 的 分 析 表 明 如 果 它 们 存在 某 些 家 系 关系 ,它们 就 会 倾向 于 喂养 同 窝 的 雏 鸟 (Burke 等 
1987) 。 如 果 观 察 到 一 只 雄 鸟 在 雌 鸟 已 受精 还 未 产 卵 前 一 段 时 期 内 排外 性 地 去 接近 肉 性 ,那么 它 就 更 
倾向 于 帮助 喂养 , 而且 由 雄性 喂养 的 程度 与 排外 性 地 接近 肉 乌 的 程度 显著 相关 。 指 纹 分 析 的 数据 表 
明 ,用 观察 接近 的 途径 是 一 个 好 的 家 系 指 示 , 所 以 这 就 意味 着 雄性 岩 岗 就 是 用 它们 接近 肉 鸟 的 程度 来 
决定 是 否 喂 养 雏 鸟 .随后 在 一 系列 的 去 除 (removal) 实 验 中 , 通过 人 工 操作 使 雄性 个 体 交 配 成 功 ( 通 过 
DNA 指纹 来 确认 )， 以 上 观点 被 实验 所 证 实 (Davis 等 1992)。 

就 象 在 岩 岗 的 研究 中 的 情况 一 样 ,在 只 有 少数 的 雄性 候选 者 的 情况 下 , 应 用 多 位 点 指纹 分 析 能 
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有 效 地 指示 家 系 , 但 是 这 经 常 需 要 对 许多 潜在 的 双亲 作 检 验 。 在 这 种 情况 下 ,应 用 一 个 单位 点 指纹 分 
析 的 系统 是 更 有 效 的 , 它 能 在 一 系列 高 度 多 态 位 点 上 指示 个 体 的 基因 型 Gibbs 等 (1990) 将 多 位 点 和 
单位 点 指纹 分 析 结 合 起 来 ,鉴别 了 28%% 第 3 代 红 翅 乌 和 鹊 幼 鸟 的 几乎 所 有 父 本 ,这 些 幼 鸟 不 是 由 拥有 
它们 出 生地 的 雄性 所 生 的 。 这 就 说 明了 在 一 个 雄性 的 领地 上 产生 的 后 代数 和 它 的 实际 生殖 成 功 之 间 
没有 显著 的 相关 ,而 且 在 它们 自己 领地 上 生育 较 大 比例 后 代 的 这 些 雄 性 也 进行 了 较 多 的 额外 交配 的 
受精 。Gibbs 及 其 合作 者 所 用 的 单位 点 探 针 是 一 个 鼠 的 组 织 相 容 性 (histocompatibility) 位 点 cDNA , 它 
的 用 途 是 通过 与 一 包含 限制 性 片段 的 小 卫星 的 偶然 杂交 而 发 现 的 ;但 是 没有 发 现 它 普遍 能 用 于 其 它 
的 鸟 类 (Gibbs, 私 人 通信 )。 分 别 获 得 高 多 态 性 的 小 卫星 或 微 卫 星 位 点 的 特异 性 探 针 或 引物 的 一 般 性 
的 方法 都 是 可 行 的 ( 见 前 文 ) ,而且 这 样 一 些 位 点 结合 使 得 多 位 点 指纹 法 变 得 过 时 (Wong 等 1987， 
Hanotte 等 1991a) 。 其 它 的 分 子 方法 偶而 也 用 到 .。 Quinn 及 其 合作 者 们 发 现 由 雪 雁 中 随机 克隆 的 一 系 
列 RFLP 有 可 观 的 变异 ,并 且 可 用 来 进行 这 个 种 的 家 系 分 析 (Quinn 和 White,1987,Quinn 等 1987) 。 
Williams 和 Strobeck(1986) 确 认 了 果 蝇 了 染色 体 的 核糖 体 基 因 的 特异 性 RFLPs, 由 此 我 们 能 够 揭示 
在 野外 种 群 中 雌性 果 蝇 发 生 过 多 次 交配 .本 领域 更 详细 的 论述 已 超出 本 文 的 范围 ,读者 可 参考 一 些 已 
发 表 的 综述 (Burke 1989,Burke 等 1991b 和 Burke 等 1991a 中 的 其 它 论文 )。 


3.3 种 群 结构 


种 群 结构 是 广义 的 话题 ,包括 从 社 群 (social groups) 内 到 种 群 间 在 各 种 水 平 上 研究 亲缘 关系 与 遗 
传 分 化 。 在 前 面 一 节 内 ,我 们 单独 讨论 了 近 缘 家 族 关 系 的 分 析 。 

除 等 位 酶 不 属于 本 评述 的 范围 外 ,线粒体 DNACmtDNA) 是 用 于 许多 种 群 分 化 研究 的 大 分 子 
(Avise 等 综述 1987)。 例 如 ,84 只 座 头 鲸 (humpback whale) 的 mtDNA( 由 皮肤 活体 解放 得到) 的 
RFLP 分 析 证 明 ,在 亚 种 群 之 间 , 以 及 来 自 北 大 西洋 和 北 太 平 洋 的 种 群 之 间 有 明显 的 单 模 标本 (haplo- 
types) 的 分 离 (Baker 等 1990) 。 单 模 标本 的 地 理 分 布 与 先前 报道 的 夏季 取 食 地 与 冬季 繁殖 地 之 间 的 迁 
移 模 式 有 惊人 的 一 致 。 研 究 者 认为 ,这 种 遗传 分 离 反 映 了 迁移 目的 的 母系 习性 (materal traditions in 
migratory destination)”, 揭示 了 要 考虑 到 行为 模式 在 种 群 结 构 分 析 中 的 重要 性 。 在 植物 中 ,质粒 DNA 
也 提供 了 很 多 类 似 mtDNA 同样 的 进展 ,并 已 在 少数 的 种 群 结构 研究 中 得 到 应 用 (如 Goff 和 Coleman 
1988). 

从 总 基因 组 文库 中 分 离 的 随机 克隆 已 在 种 群 水 平 上 用 于 RFLP 的 研究 。Mecdonald 和 Martinez 
(1990) 研究 了 从 一 块 麦 地 得 到 的 一 种 真菌 病原 体 Mycosphaerella graminicola 的 种 群 结 构 。 他 们 发 现 
了 高 程度 的 遗传 变异 ,包括 一 片 叶 子 上 不 同 的 侵蚀 斑 (lesions) 之 间 。 他 们 的 研究 强调 了 在 确认 从 不 同 
地 理 位 置 取得 的 少量 样品 是 否 代表 种 群 水 平 的 变异 之 前 ,评估 空间 尺度 变异 的 重要 性 。 

也 偶尔 使 用 另外 一 些 DNA 标记 类 型 ,如 核糖 体 DNA( 如 Learn 和 Schaal 1987)。 尽 管 一 般 记 为 小 
卫星 进化 太 快 而 不 能 用 于 种 群 水 平 的 分 析 ,Gilbert 等 ( 1990) 发 现在 讨论 南 加 利 福 尼 亚 的 海峡 岛 
(channel islands) | &/}\ MI (dwarf foxes) 小 的 分 离 种 群 的 系统 发 育 , 以 及 分 离 种 群 间 遗 传 变异 的 相关 
水 平时 ， 指 纹 模 式 能 提供 有 益 的 信息 。 在 大 部 分 分 离 的 岛 上 ,他 们 发 现在 取样 的 狐 之 间 没 有 指纹 变 
异 , 一 个 指纹 模式 甚至 在 自 交 的 实验 室 小 鼠 群 中 也 未 发 现 过 。 多 位 点 指纹 在 鉴别 自然 种 群 内 无 性 系 成 
员 方 面 也 可 有 重要 价值 CNybom 和 Schaal 1990,Turner 等 1990,Carvalho 等 1991 ,Brookfield 1992) 。 

PCR 使 得 在 种 群 研究 中 收集 实际 的 DNA 序列 是 可 行 的 ,而 且 它 也 允许 用 收藏 在 博物 馆 中 的 标 
本 作 实 验 。Thomas 等 (1990) 利 用 这 种 有 利 条 件 ,发 现 78 年 间 3 40K Ckangaroo rat) 种 群 的 种 群 结 构 
没有 明显 的 变化 。 


3.4 迁移 和 基因 流 


当然 ,迁移 是 种 群 结构 的 一 个 重要 成 分 ,所 以 ,同样 的 方法 学 上 的 各 种 途径 是 有 用 的 。 在 这 个 前 提 
下 ,我们 列举 了 一 些 实例 来 着 重 强调 应 用 分 子 的 方法 有 时 可 以 推断 迁移 模式 。 
例如 ,在 现代 人 的 地 理 起 源 这 个 有 争议 的 问题 上 , 通过 从 多 类 人 种 和 黑猩猩 取样 的 mtDNA 替 
位 环 区 (displacement loop region) 的 序列 比较 ， 确 认 了 人 类 mtDNA 进化 树 的 非洲 起 源 ( Vigilant 等 
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1991; 例外 见 Templeton 1992) 。 Hagelberg 等 (1989) 在 研究 人 类 的 人 口 迁 移 时 ,扩展 了 PCR MAR. 
证 明了 扩 增 5450 年 以 上 的 人 骨 的 mtDNA 的 可 行 性 。 在 一 系列 研究 上 ,无 疑 地 ,对 在 形态 学 上 无 症状 
的 骨头 片段 作 了 鉴定 。 

将 RFLP 分 析 与 等 位 酶 相 结 合 ,mtDNA 也 被 用 在 遗传 学 上 研究 和 确认 蝶 晨 两 个 种 之 间 的 历史 
上 描绘 的 杂种 地 带 (hybrid zone) 的 变迁 〈 Arntzen 和 Wallis 1991). 40 SA ESC BER CT riturus 
marmoratus ) FH # HY A ef A BY RMR CT. crzstatxs) 种 群 的 特征 是 存在 一 种 低 的 但 可 辨认 的 渐 渗 的 mar- 
moratus 等 位 基因 频率 。 

Culex pipiens 蚊 通 过 非特 异性 过 量 的 产生 多 种 酯 酶 来 抗 有 机 磷酸 酯 杀 虫 剂 。 这 些 酯 酶 中 有 一 个 
在 B 位 点 上 用 电泳 可 察觉 到 的 扩 增 了 的 BB, 等 位 基因 。 来 自 非 洲 、 亚 洲 和 北美 洲 样品 的 B, 酯 酶 结构 基 
因 序 列 的 限制 位 点 分 析 显 示 其 高 度 的 同 源 性 。 这 就 指出 了 OB, 等 位 基因 是 由 单 突 变 发 展 而 来 ,并 通过 
对 杀 虫 剂 诱导 选择 的 有 利 性 ,在 世界 范围 种 群 之 间 快 速 扩散 。 


3.5 渐 渗 现 象 与 杂交 地 带 


适用 于 种 群 结构 分 析 的 技术 也 适 于 特殊 情况 的 杂交 地 带 。 分 析 沿 着 杂交 地 带 的 基因 渐 渗 ,mtD- 
NA 特别 有 价值 CHarrison 1989 SiR). BRA DNA 也 应 用 于 某 种 程度 的 研究 中 (如 Baker 等 1989) 。 

Arnold 等 (1991) 用 一 种 选择 叶绿体 基因 的 PCR 和 RAPD 来 研究 路 易 斯 安 那 营 尾 杂 交 种 的 形 
成 。 物 种 专 有 的 RAPD 标记 的 地 理 分 布 支持 这 样 一 个 假设 :7Tzrzs fulva Al I. hexagona 通过 基因 流 导 致 
了 定位 的 和 扩散 的 渐 渗 .一 个 扩 增 的 叶绿体 基因 片段 (携带 在 峻 性 细胞 质 中 ) 的 RFLP 分 析 , 说 明 是 由 
于 传粉 而 不 是 种 子 散布 导致 了 基因 流 。 

这 个 领域 提供 了 某 些 成 功 应 用 DGGE 的 首 例 。Lessa(1992) 应 用 DGGE 研究 了 一 种 地 鼠 的 杂交 
地 带 。 

为 了 了 解 在 形态 上 还 识别 不 了 有 杂种 存在 的 地 区 ,在 有 杂交 潜 势 的 白 标 物种 间 基 因 交 换 的 程度 ， 
Whittemore 和 Schaal(1991) 观 察 了 用 来 自 狼 牵 牛 叶绿体 和 大 豆 细胞 核 核糖 体重 复 (ribosomal repeat ) 
的 克隆 探 针 消化 的 基因 组 DNA 限制 片段 印迹 。 他 们 发 现 , 虽 然 叶 绿 体 基因 型 有 某 些 大 尺度 的 地 理 变 
异 , 在 同一 地 点 一 起 生长 的 物种 (包括 常 绿 的 和 落叶 的 ) 却 经 常 地 具有 相同 的 叶绿体 基因 型 。 一 个 种 
在 不 同 的 地 点 具有 不 同 的 叶绿体 基因 型 ,而 细胞 核 核 糖 体 的 标记 则 显示 了 一 种 分 布 格局 与 所 期 望 的 
物种 界线 (boundaries) 是 一 致 的 。 他 们 在 叶绿体 核 DNA 中 观察 到 的 地 理 变 异 和 明显 的 基因 流 的 极 明 
显 的 悬殊 差别 的 格局 , 强调 了 在 依据 由 细胞 器 得 来 的 数据 解释 种 群 或 类 群 界 线 时 要 特别 谨慎 ( Pami- 
lo #l Nei, 1988). 


3.6 物种 的 鉴定 


总 DNA 的 提取 物 间 杂交 的 程度 已 被 广泛 地 作为 一 种 方法 用 来 估 测 物种 间 的 亲缘 关系 。 特 别 是 
在 原核 生物 之 间 , 当 一 些 生 物 具 90% 或 以 上 的 杂交 值 时 ,这 种 方法 就 用 来 把 它们 粗 粗 定 为 物种 
(Woese 1987)。 然 而 ,这 种 方法 的 分 辨 率 和 分 类 学 范围 经 常 是 低 的 ,需要 作 比 较 就 要 求 有 大 量 的 
DNA, 

物种 特异 性 探 针 在 研究 宿主 一 媒介 (vector) 一 寄生 物 系统 中 特别 有 用 。Kukla 等 (1987) 使 用 包含 
有 重复 序列 的 放射 活性 标记 的 限制 片段 克隆 , 鉴定 了 采 采 蝇 组 织 中 锥 虫 的 种 和 亚 种 。 他 们 发 展 了 一 
种 应 用 于 野外 的 方法 ,将 分 离 的 蝇 腹 部 整个 地 放 在 尼龙 膜 上 与 标记 的 探 针 杂交 ,就 能 确认 和 鉴定 肠 锥 
虫 . 通 过 筛选 _ 个 基因 文库 ,Harnett 等 (1989) 发 现 并 测定 了 一 朝 核 背 酸 探 针 的 序列 , 它 能 区 别 引起 人 
类 河 盲 症 (river blindness) 的 一 种 线虫 Onchocerca volvulus 和 形态 上 相似 但 不 是 病原 体 的 另外 一 个 
Onchocerca Ff , E, {1148 # ZE [Fl FE AY HA Cblackfly ) #E dP _E 。 

Persing 等 (1990) 应 用 包 柔 氏 螺 旋 体 (Boela) 特 异性 引物 和 PCR & DEF TED Te BE tr ASE HP AY 
症状 DNA 片段 ,表明 Lyme 疾病 的 临床 发 现 至 少 30 年 前 就 已 经 在 美国 存在 了 。.Lyme 病原 体 Borrelia 
burgdorferi 另外 一 随机 克隆 的 序列 分 析 , 能 够 帮助 设计 PCR 引物 ,以 此 把 北美 类 型 与 欧洲 和 亚洲 隔 
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离 类 型 分 辩 开 (Rosa 等 1991 ) 。 

Goff 等 (1988) 应 用 探 针 研 究 Anaplasma marginde 表面 蛋白 基因 ,检测 了 峰 与 牛 被 传染 的 频率 。 
由 此 可 监测 宿主 携带 状态 、 疾 病 传 染 方式 和 地 方 性 兽 病 区 蝗 传 染 的 流行 。Rowan 和 Powers(1991) 测 
定 了 由 22 个 海洋 动物 宿主 类 群 上 取得 的 131 个 个 体 隔 离 群 的 单 细 胞 藻类 共生 体 的 rDNA A) WBE 
段 序 列 。 系 统 发 育 上 远 缘 的 宿主 上 发 现 了 近 缘 的 藻类 。 这 种 折 囊 的 和 如 此 广 的 分 布 区 对 营 类 共生 体 
来 说 ,是 一 种 结合 的 群 聚 模式 ， 这 种 模式 与 某 些 动物 寄生 物 的 分 化 历史 有 时 同 宿主 一 致 的 情况 是 十 
分 不 一 样 的 (Page 1990). 

DNA 分 析 可 以 进行 血液 寄生 节肢 动物 的 寄主 的 分 类 。 为 更 好 地 说 明 这 种 方法 的 潜力 ,Coulson 等 
《1990) 应 用 单位 点 小 卫星 指纹 分 析 蚊 子 的 肠子 内 含 物 ,得 到 了 被 这 种 蚊 叮 过 的 人 的 基因 型 。 


7 和 区 地 


生态 学 家 之 所 以 对 系统 学 感 兴趣 ,是 考虑 到 去 识别 特殊 的 物种 以 及 对 物种 间 进 化 关系 的 理解 。 分 
子 技术 可 广泛 地 应 用 于 系统 学 的 研究 ,这 个 领域 已 广泛 地 评述 过 了 (Hillis 和 Moritz 1990,Hewitt 等 
1991; 表 中 的 实例 )。 实 际 上 , 任何 客观 的 .基于 遗传 的 特性 都 具有 可 为 分 类 学 提供 资料 的 意义 ,不 同 
方法 的 价值 将 按 所 研究 的 群体 内 遗传 多 样 性 的 大 小 而 不 同 。 尽 管 由 DNA 一 DNA 杂交 提供 的 表 型 性 
的 方法 成 功 地 应 用 着 (特别 是 在 鸟 类 中 ;Sibley 和 Ahlquist 1990);DNA 序列 的 系统 发 育 分 析 被 看 好 ， 
而 且 现 在 由 于 PCR 的 发 明 而 使 之 变 得 更 加 可 行 。 在 这 之 前 ,只 有 核糖 体 RNA 基因 能 测序 到 值得 注 
意 的 程度 (Woese 1987 ,Hillis 和 Dixon 1991). 

应 用 PCR 的 首次 研究 为 测定 mtDNA 序列 而 研究 了 通用 引物 的 特性 (Kocher 等 1989)。 例 如 ， 
Richman 和 Price(1992) 应 用 这 样 的 引物 ,从 8 个 Phylloscopus 鸣 禽 同 地 种 ,得 到 了 具有 910 个 碱 基于 
的 线粒体 细胞 色素 b 序列 ， 建立 了 这 些 群 体 的 系统 发 育 。 支 持 这 些 物种 的 形态 学 、 取 食 行为 和 生态 
学 适应 解释 的 一 个 比较 分 析 中 ,系统 发 育 被 用 来 核实 共同 祖先 的 影响 。 

物种 的 分 类 与 保护 特别 有 关系 ,这 一 点 已 被 一 系列 mtDNA 变异 的 研究 结果 所 强调 过 ,在 设想 是 
分 离 的 小 地 鼠 (Learn 等 1982) 和 海滨 麻雀 (Avise 和 Nelson 1989) 的 物种 或 亚 种 间 , 在 可 能 是 杂种 起 
源 的 红 狼 (Wayne 和 Jenks 1991) 以 及 被 外 源 基 因 渐 渗 的 濒危 的 美洲 独 和 灰 狼 种 群 ( 见 O'Brien 和 
Mayr 1991) 中 ,都 见 不 到 有 mtDNA 明显 的 分 化 。 通 过 使 用 PCR 对 红 狼 标本 的 分 析 ,排除 了 杂交 是 最 
近 发 生 的 可 能 性 .分 子 系统 学 也 用 来 揭示 这 样 的 事例 一 一 不 同 的 分 类 群 可 被 归并 为 一 个 种 ,特别 是 在 
形态 上 保守 的 谱系 中 (Daugherty 等 1990) 。 


3.8 群落 多 样 性 


多 个 rDNA 小 亚 基 序 列 的 同时 扩 增 提供 了 一 个 检测 微生物 自然 多 样 性 的 有 用 方法 。Giovannoni 
等 (1990) 把 从 浮游 细菌 的 自然 种 群 得 到 的 16s rRNA 基因 扩 增 部 分 的 克隆 测 了 序 。 经 过 培养 ,增加 了 
可 检测 的 多 样 性 ,一 些 以 前 未 知 的 分 类 群 既 在 系统 发 育 上 是 分 离 的 ,又 是 微生物 群落 中 在 数量 上 重 
要 的 成 员 。 

Ward 等 (1990) 简 单 地 检测 了 一 陆地 温泉 中 蓝藻 细菌 从 中 微生物 物种 的 组 成 。 用 一 保守 的 寡 核 
苷 酸 引 物 ,他 们 通过 从 环境 样品 中 取得 的 16s rRNA 合成 了 DNA。 经 过 克隆 和 测序 ,并 与 来 自 相 似 生 
境 培养 的 有 机 体 的 16s rRNA 序列 相 比较 后 发 现 ,所 检测 的 8 个 序列 类 型 没有 一 个 同 这 一 地 点 以 前 
CAN 14 种 生物 相 一 致 。 这 清楚 地 表明 ,分 子 工 具 可 以 揭示 出 微生物 群落 中 从 前 未 检测 出 的 多 样 性 ， 
而 且 新 生物 体 的 检测 并 不 限于 稀有 类 和 群 。 


DNA 水 平 变 异 的 程度 和 类 型 ,特别 是 在 物种 内 ,只 是 最 近 才 为 人 所 知 。 新 技术 特别 是 PCR 的 发 
明 ,使 得 检测 这 类 变异 变 得 容易 起 来 。 一 般 来 讲 , 以 PCR 为 基础 的 方法 已 经 成 为 并 且 将 来 仍 是 我 们 所 
选择 的 研究 方法 。 
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出 于 对 一 些 有 利 因素 的 考虑 ,mtDNA 已 经 成 为 在 DNA( 限 制 片段 ) 水 平 上 研究 不 同 种 群 的 通用 
信息 源 ( 见 Hillis 和 Moritz 1990) 。 这 延伸 了 由 了 PCR 获得 序列 数据 的 情况 ,原因 可 能 是 由 于 mtDNA 分 
子 具 有 比 核 DNA FIBA HN BER BR; Mt mtDNA 一 些 区 域 的 了 解 和 高 度 不 同 的 进化 速率 ; 
“通用 ?引物 的 可 用 性 (Kocher 等 1989) 以 及 线粒体 基因 组 的 单 倍 性 。 最 后 一 点 避免 了 在 双 倍 体 核 基因 
组 中 潜在 的 问题 ,也 避免 了 测定 单 模 标本 的 序列 (Kreitman 1991)。 通 常 核 标记 也 是 可 行 的 (Pamilo 和 
Nei 1988) ,虽然 在 这 里 经 常用 到 “等 位 酶 ,而 DNA 标记 在 确定 变异 程度 时 能 提供 更 大 的 灵活 性 。 由 
于 物种 内 典型 的 核 苷 酸 多 态 性 水 平 是 1% 或 更 小 (Kreitman 1991) ,对 生态 学 家 来 说 ,样品 的 大 量 序列 
分 析 一 般 不 是 最 适合 的 方法 .于 是 ,我 们 转向 更 简捷 的 方法 ,例如 ,应 用 DGGE , 寡 核 苷 酸 探 针 ,限制 性 
酶 切片 段 ,或 者 对 已 测序 的 多 态 区 中 的 PCR 产物 的 简单 的 大 小 测度 。 

虽然 这 些 技 术 变 的 易于 掌握 ,但 它们 的 成 功 应 用 仍 需要 很 多 的 脑力 劳动 , 而 且 生 态 学 家 要 注意 ， 
不 要 陷 人 只 把 实验 室 工 作 看 作 简单 技术 活动 的 错误 之 中 。 最 后 ,分 子 方 法 在 生态 学 过 程 研究 中 的 应 
用 ,将 是 由 不 辞 辛劳 ,互相 了 解 对 方 优 缺 点 的 科学 家 们 将 野外 和 实验 室 工作 巧妙 结合 的 结果 。 
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人 类 健康 … 
物种 经 济 学 … 


林业 ……… 

渔业 … sees oe ee cee cee cen cee cen ces cence cesses ces ceesesseses 

了 解 和 保护 地 球 的 生命 支持 系统 … 
提高 日 常生 活 的 质量 … 
加 强 科学 研究 … 

2000 年 系统 学 议程 的 任务 … has nds kklaenoeeaiecce eee 
第 一 项 任务 :全 球 物种 多 样 性 的 发 现 ,描述 和 编目 … 


第 二 项 任务 :分 析 这 个 全 球 发 现 计 划 获 得 的 信息 ,并 将 其 融合 于 


一 个 能 反映 生命 史 的 预测 性 分 类 系统 … 


第 三 项 任务 :把 这 个 全 球 计划 获得 的 信息 整理 成 为 一 种 有 效 的 .可 查询 的 形式 ， 


以 最 大 限度 地 满足 科学 和 社会 的 需求 … 
迎接 挑战 :基础 设施 与 人 才 资 源 - 


建立 和 加 强 系 统 学 研究 中 心 及 标本 收藏 站 pp 
教育 .培训 及 人 才 资 源 开 发 .pe 
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2000 年 系统 学 议程 :制订 生物 圈 计 划 
一 一 全 世界 物种 的 发 现 、 描 述 和 分 类 的 全 球 计划 技术 报告 


前 言 


.遐想 你 被 置身 于 一 个 陌生 但 又 美丽 的 星球 .四 周 景色 宜人 .漫步 沙滩 ,翻滚 的 波浪 拍打 着 海岸 ， 
岸上 绿 草 悠悠 ,溪流 涛 涯 ,茂密 的 森林 衬托 着 远 处 白 拒 拒 的 雪山 .你 只 消 一 警 便 能 领悟 到 这 是 个 充满 
生命 的 世界 一 一 种 类 如 此 之 多 令 人 感到 茫然 , 乍 看 约 或 令 人 发 闸 。 

试想 会 有 多 少 东西 能 从 这 个 新 的 星球 了 解 到 ,而 这 些 知识 会 有 多 人 么 的 重要 。 有 些 植物 可 能 会 变 成 
新 的 食物 ,哺育 饥饿 的 生灵 ,或许 化 作 新 的 药物 ,解除 疾病 的 痛苦 ;有 些 动物 也 许 能 有 效 坎 制 作物 害虫 
的 危害 ;微生物 或 就 能 够 分 解 污染 物 ,或 就 能 够 维持 住 一 个 拥挤 世界 的 大 气 。 再 想 一 想 , 你 这 一 辈子 能 
在 这 个 迷人 的 新 世界 里 的 寿命 是 如 此 之 短 , 因 此 你 只 能 在 这 短暂 的 时 窗 内 把 所 有 的 一 切 都 发 现 出 来 。 

事实 上 你 无 需 穷 尽 你 的 想象 力 , 因 为 这 个 渺茫 的 星球 就 是 我 们 的 地 球 。 我 们 星球 上 的 生命 丰富 得 
让 人 吃惊 , 它 造 福 人 类 的 潜能 同 我 们 约 想 到 的 任何 一 个 星球 一 样 可 观 , 更 不 用 说 我 们 今后 还 要 继续 求 
索 。 短 暂 的 时 窗 也 同样 是 事实 。 我 们 地 球 的 表面 ,不 论 是 陆地 还 是 水 域 , 都 由 于 人 口 膨 胀 带 来 对 住房 、 
食物 和 燃料 的 需求 而 面临 着 急骤 的 退化 。 今 后 一 代 或 两 代 人 口 的 迅猛 增长 加 之 资源 消耗 ,将 在 我 们 尚 
有 机 会 发 现 更 不 用 说 仔细 研究 我 们 正在 失去 什么 之 前 ,大 量 生命 的 多 样 性 将 被 毁坏 。 

当 得 知 地 球 上 数 百 万 计 的 物种 尚未 发 现 或 描述 后 ,许多 人 都 感到 惊奇 .实际 上 ,地 球 上 的 生命 是 
如 此 之 丰富 ,对 某 些 生物 类 群 的 研究 是 如 此 之 肤浅 ,我 们 仍 不 清楚 地 球 上 到 底 生 活 有 多 少 物种 。 假 如 
地 球 上 有 一 千 万 或 五 千 万 个 物种 ,几乎 任何 一 个 生物 学 家 都 不 会 感到 吃惊 。 

然而 ,我 们 确实 知道 生命 多 样 性 过 去 对 我 们 有 多 人 么 重要 ,将 来 对 我 们 会 有 多 人 么 重要 。 我 们 也 知道 ， 
研究 这 种 多 样 性 可 以 告诉 我 们 这 个 星球 的 生命 史 是 什么 ,这些 研 究 怎样 来 帮助 我 们 解决 进入 二 十 一 
世纪 后 世界 面临 的 最 紧迫 的 难题 。 我 们 目前 正面 对 一 个 前 所 未 有 的 机 遇 ,一 个 在 我 们 失败 后 子孙 后 代 
不 再 会 有 的 机 遇 。 

系统 学 是 生物 学 的 一 个 分 支 科 学 , 它 的 任务 是 掌握 生命 的 多 样 性 .系统 学 家 把 掌握 的 知识 划分 到 
分 类 系统 ,以 此 表示 我 们 对 现存 物种 或 过 去 年 代 物 种 的 了 解 ,进而 准确 推测 尚未 了 解 的 物种 .世界 系 
统 生 物 学 家 被 迫切 地 要 求 加 紧 对 地 球 生 命 的 探索 ,以 便 为 全 社会 提供 必 不 可 少 的 背景 知识 ,发 现 和 利 
用 新 的 生物 资源 ,并 制定 保护 地 球 生 物 多 样 性 的 有 效 决 策 。 

美国 植物 分 类 学 家 学 会 .系统 生物 学 家 学 会 .Wili Hennig 学 会 及 系统 学 标本 馆 联合 会 组 成 的 联 
合体 


1994 年 
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内 容 提 要 


地 球 上 的 物种 ,包括 人 ,共同 构成 了 一 块 精美 的 纺织 品 。 这 块 纺 织品 塑造 了 对 维持 生命 至 关 重 要 
的 大 气 气候、 土壤 .水 及 地 球 的 其 他 生态 学 特性 。 构 成 纺织 品 的 一 百 多 万 根 丝线 (物种 ) 为 系统 生物 学 
家 , 即 探索 地 球 生物 多 样 性 的 科学 家 所 发 现 和 描述 . 反 过 来 ,物种 描述 又 为 其 他 各 项 研究 的 开展 打下 
基础 ,例如 物种 间 关 系 的 研究 以 及 告诉 我 们 生命 多 样 性 组 成 及 其 历史 的 分 类 研究 .物种 的 分 类 犹如 强 
大 的 理论 工具 ,能 帮助 我 们 了 解 、 维 持 并 合理 利用 我 们 继承 下 来 的 丰富 的 生物 财富 。 

系统 生物 学 研究 在 过 去 两 百 多 年 中 取得 了 重大 的 成 就 ,尽管 如 此 ,我 们 对 生命 的 了 解 还 远 远 不 
够 , 数 千 万 计 的 物种 仍 有 待 我 们 去 探索 ,去 认识 .这 些 物 种 中 可 能 有 维持 复杂 的 生态 平衡 的 物种 ,可 能 
有 增加 和 扩大 农业 生产 的 物种 ,也 可 能 有 会 成 为 消灭 人 类 健康 之 敌 的 新 药 和 特效 药 的 物种 。 令 人 欣慰 
的 是 ,近期 系统 学 的 发 展 适 时 提出 了 制订 生物 圈 计 划 的 艰巨 任务 ,其 目的 就 是 在 于 掌握 物种 多 样 性 的 
巨大 的 范围 。 

对 人 类 今后 的 生存 和 幸福 来 说 ,当前 迎接 这 一 挑战 比 以 往 任 何 时 候 都 要 重要 。 当 今世 界 逐 步 面临 
多 样 性 减少 和 栖息 地 消失 的 境况 ,人 类 对 珍贵 生物 资源 的 需求 也 在 不 断 提 高 .为 此 ,物种 多 样 性 的 基 
础 系统 学 研究 势 在 必 行 .世界 上 的 自然 资源 管理 者 ,药物 开发 者 .保护 生 物 学 家 、 生 态 学 家 及 其 他 有 关 
人 十 只 有 共同 努力 ,才能 付 之 于 实现 。 

对 地 球 生物 多 样 性 了 解 得 越 多 ,人 类 保护 陆地 和 海洋 自然 生境 的 能 力 就 越 强 。 如 果 想 让 子孙 后 代 
享有 我 们 所 依赖 的 地 球 生 命 的 多 样 性 ,我们 就 必须 求 得 这 些 知 识 。 

国际 系统 生物 学 界 倡议 的 2000 年 系统 学 议程 旨 在 实现 世界 各 国 所 追求 的 一 个 科学 目标 , 即 发 现 、 
描述 和 分 类 地 球 上 的 物种 。 实 现 这 个 目标 要 求 国际 社会 努力 完成 三 个 彼此 关联 的 科学 任务 。 

第 一 项 任务 :全 球 物种 多 样 性 的 发 现 、 描 述 和 编目 ; 

第 二 项 任务 :分 析 这 个 全 球 发 现 计 划 获 得 的 信息 ,并 将 其 融合 于 一 个 能 体现 生命 史 的 预测 性 分 类 
系统 ; 

第 三 项 任务 :把 这 个 全 球 计 划 获 得 的 信息 整理 成 为 一 种 有 效 的 、 可 查询 的 形式 ,以 最 大 限度 地 满 
足 科 学 和 社会 的 需求 。 

它 对 科学 和 社会 的 作用 巨大 ,具体 表现 在 : 

1. 新 发 现 的 物种 将 扩充 社会 有 用 资源 的 编目 ; 

2. 新 的 系统 学 数据 将 会 用 维持 和 利用 各 国 物 种 多 样 性 所 必需 的 知识 把 保护 学 家 政策 制定 者 及 
生物 资源 管理 者 武装 起 来 。 

3. 物种 多 样 性 知识 将 有 助 于 新 产品 的 发 现 , 并 将 指导 农作物 和 药物 的 新 品种 和 改良 品种 的 选择 。 

4. 基底 数据 将 随 之 产生 ,并 用 于 监测 全 球 气候 及 生态 系统 的 变化 ,其 中 包括 物种 灭绝 速度 .生态 
系统 退化 以 及 外 来 的 .引起 病害 和 虫害 生物 体 的 传播 等 。 
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“ 浪费、 破坏 我 们 的 自然 资源 ,....….. ,将 会 损害 子孙 后 代 真 正 的 繁荣 昌盛 ,按理 说 我 们 应 把 繁荣 昌盛 
传 给 他 们 并 发 扬 光 大 ” 


一 西 奥 多 .罗斯 福 
1907 年 12 月 3 日 提交 国会 的 咨文 

我 们 与 其 他 数 百 万 物种 共同 占有 地 球 .这些 物 种 形态 多 样 ,关系 奥秘 ,是 三 十 多 亿 年 进化 的 结果 。 
地 球 上 的 物种 ,包括 我 们 本 身 , 被 汇 织 在 一 个 精美 的 生态 结构 中 。 这 个 结构 塑造 了 大 气 、 气 侯 及 地 球 的 
地 理 特 性 ,并 奠定 了 生命 本 身 的 基础 。 

人 类 依赖 于 难以 数 计 的 其 他 物种 .换言之 ,人 类 生活 的 好 坏 与 全 球 生态 网 络 的 状况 有 着 直接 的 关 
系 。 成 千 上 万 的 物种 被 人 类 用 于 食物 、 住 房 , 衣 物 药品、 商业 或 其 他 目的 .对 其 他 生命 型 的 利用 推动 了 
世界 经 济 的 发 展 ,使 我 们 每 个 人 的 生活 更 富裕 、 更 美好 。 

人 类 能 有 效 利用 其 他 物种 的 本 领 来 自 对 这 些 物种 知识 的 了 解 . 这 种 知识 从 认识 它们 是 什么 种 类 、 
它们 在 哪儿 、 它 们 会 有 什么 特征 、 它 们 与 别 的 物种 有 什么 关系 开始 地 球 上 的 生命 形式 极其 丰富 多 样 。 
迄今 为 止 ,已 描述 的 物种 大 概 不 足 150 万 种 ,但 据 专 家 估计 与 我 们 一 道 栖 居 地 球 的 物种 很 可 能 有 几 千 
万 。 记 录 和 了 解 物 种 多 样 性 对 人 类 今后 的 发 展 至 关 重要 .了解 这 些 基 本 知识 是 系统 学 这 门 科学 的 主要 
任务 。 

系统 生物 学 家 致力 于 地 球 物 种 的 发 现 \ 描 述 和 了 解 .他 们 根据 获得 的 信息 对 物种 进行 分 类 ,在 此 
基础 上 再 整理 有 关 这 些 物 种 的 所 有 生物 学 知识 ,并 制订 出 一 个 框架 ,预测 已 知 的 或 未 知 的 生活 型 的 特 
征 . 尽 管 我 们 掌握 地 球 物 种 的 知识 还 不 够 全 面 , 但 新 的 系统 分 析 方法 .生物 遗传 物质 CDNA) 的 直接 利 
用 、 尖 端的 信息 处 理 技术 .自然 历史 标本 收藏 的 增加 及 其 数据 库 的 建立 等 手段 ,都 为 了 解 全 球 生物 多 
样 性 铺 平 了 道路 。 

未 加 控制 的 人 类 活动 使 我 们 目前 正 处 于 一 个 重大 的 生物 灭绝 时 期 ,因此 目前 认识 生物 多 样 性 比 
以 往 任何 时 期 更 具有 迫切 性 据 美国 国家 研究 理事 会 的 一 份 报告 称 , 到 2100 年 很 可 能 一 半 以 上 的 现 有 
物种 都 将 灭绝 CNRC 1980) .但 就 目前 生态 系统 的 退化 速度 来 看 ,这 项 推测 可 能 还 有 些 保守 ;按照 哈佛 
大 学 著名 的 生物 学 家 下 . O. Wilson 博士 的 谨慎 估计 ,地 球 上 每 年 导致 绝 灭 的 物种 有 将 近 2 万 7 千 种 
(Wilson 1992). 人 口 的 膨胀 .贫穷 的 增长 全 球 的 冲突 及 自然 资源 的 过 度 利用 造成 了 环境 质量 严重 的 
下 降 和 物种 多 样 性 不 可 挽回 的 损失 。 

多 样 性 的 减少 伴随 着 生物 学 知识 的 损失 降低 了 各 国人 民 改 善 经 济 状况 和 提高 生活 水 平 的 能 力 。 
物种 灭绝 的 悲剧 向 国际 社会 发 出 了 严峻 的 挑战 一 一 在 人 类 生物 遗产 永久 地 失去 之 前 发现、 保存 和 认 
识 其 多 样 性 生物圈 的 未 来 尚 有 赖 于 各 国政 府 在 今后 几 十 年 内 的 共同 努力 .近期 在 里 约 热 内 卢 召 开 的 
联合 国 环境 与 发 展 大 会 (UNCED) 已 经 认识 到 这 一 点 .大 会 上 国际 社会 认识 到 ,在 保持 经 济 持续 发 展 
的 同时 有 必要 维持 生物 圈 的 完整 性 .各 国 通过 全 球 行动 计划 “二 十 一 世纪 议程 也 呼吁 要 加 强 对 地 球 
生物 多 样 性 的 了 解 程度 。 | 

在 发 展 经 济 的 同时 兼顾 持续 利用 取决 于 综合 的 政治 决策 和 经 济 决策 .成 功 的 决策 必须 以 各 种 准 
确 的 地 球 物种 科学 库 的 信息 为 依据 。 为 迎接 掌握 生命 多 样 性 重任 的 挑战 ,国际 系统 学 界 提出 了 一 项 控 
索 和 研究 计划 一 一 2000 年 系统 学 议程 :绘制 生物 圈 图 谱 。 有 了 全 社会 的 共同 决心 和 一 致 支持 ,全 世界 
的 系统 学 家 们 提出 了 一 项 加 速 研 究 的 计划 ,以 期 在 今后 25 年 中 解答 下 列 问题 : 

. 地球 上 的 物种 是 什么 ? 

2. 它们 分 布 在 什么 地 方 ? 

3. 它们 具有 什么 样 的 特性 ? 

.它们 之 间 的 关系 如 何 ? 

本 项 研究 获得 的 知识 将 被 整理 成 为 预测 性 的 分 类 系统 和 数据 库 ,使 其 成 为 认识 、 维 持 和 永 续 利 用 
人 入 
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人 类 继承 的 巨大 的 生物 财富 的 有 效 工 具 。 


系统 学 是 建立 在 以 下 工作 之 上 的 科学 : 
DEF: 


发 现 、 描 述 和 划分 物种 或 物种 类 群 ( 合 称 分 类 单元 ) 的 科学 
系统 发 育 分 析 : 


发 现 生 物种 类 群 间 的 进化 关系 
RE: 


按照 进化 关系 将 物种 最 终归 为 不 同 的 类 群 
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2000 年 系统 学 议程 :制订 生物 圈 计 划 


世界 系统 学 界 通过 2000 年 系统 学 议程 果断 地 提出 了 一 项 迎合 社会 需求 ,有 明确 科学 目标 的 计划 : 

发 现 、 描 述 和 划分 全 世界 的 物种 。 

迎接 生物 多 样 性 危机 的 挑战 和 成 功 地 完成 这 项 议程 要 求 国际 上 的 广泛 参与 。 议 程 确 定 了 三 项 彼 
此 关联 的 研究 任务 : 

1. 全 球 物 种 多 样 性 的 发 现 、 描 述 和 编目 ; 

2. 分 析 这 个 全 球 发 现 计 划 获 得 的 信息 ,并 将 其 融合 于 一 个 能 体现 生命 史 的 预测 性 分 类 系统 ; 

3. 把 这 个 全 球 计 划 获 得 的 信息 整理 成 为 一 种 有 效 的 、 可 查询 的 形式 ,以 最 大 限度 地 满足 科学 和 社 
会 的 需求 。 


系统 学 知识 及 生物 多 样 性 的 价值 


“每 一 个 国家 都 有 三 种 财富 , 即 物 质 财富 、 文 化 财富 和 生物 财富 .前 两 者 我 们 基本 了 解 ,因为 它们 
是 目 常 生活 的 组 成 部 分 .生物 多 样 性 问题 的 实质 是 没有 给 予 生物 财富 以 足够 的 重视 。 这 是 一 个 重大 
的 战略 性 失误 . 随 着 时 间 的 推移 ,这 次 失误 越 来 越 会 让 人 们 感到 居 异 ” 
—E.O. Wilson，1992 年 ， 第 311 页 
尽管 人 们 依赖 数 以 万 计 的 物种 获取 食物 、 住 房 、 药 品 及 其 他 必 不 可 少 的 物质 ,但 据 科 学 预示 生物 
畔 的 未 知 部 分 还 蕴藏 着 更 大 的 潜力 。 在 全 球 环境 面临 各 种 不 利 改变 的 当今 ,掌握 更 多 的 物种 多 样 性 知 
识 尤为 重要 。 这 些 知识 大 部 分 来 自 系 统 学 基础 研究 , 即 发 现 和 描述 新 物种 ,确定 物种 的 特征 及 与 其 他 
物种 的 关系 ,按照 这 些 数据 进行 分 类 并 建立 预测 性 的 信息 查询 系统 。 由 此 可 见 , 对 于 试图 了 解 生命 多 
样 性 .为 子孙 后 代 保 护 和 管理 生命 多 样 性 的 基础 科学 和 应 用 科学 研究 人 员 来 说 ,系统 学 知识 万 基础 之 
基础 。 


人 类 健康 


世界 上 有 几 亿 人 在 蒙受 生物 引发 的 疾病 带 来 的 痛苦 .为 了 解除 这 些 疾 病 对 人 类 的 折磨 ,全 世界 每 
年 投入 的 经 费 高 达 几 十 亿美 元 。 纵 观 世 界 上 所 有 的 疾病 ,目前 最 让 人 深恶痛绝 的 有 三 类 寄生 虫 ,它们 
是 导致 痉 疾 的 原生 动物 .引发 日 本 血吸虫 病 的 血液 时 虫 及 造成 爱滋病 的 HIV 病毒 .此 外 ,世界 上 25%5 
的 人 在 肠 内 寄生 有 影响 儿童 身体 和 智力 发 育 的 帼 虫 。 自 1979 年 以 来 ,细菌 中 有 270 个 新 属 和 大 约 1100 
个 新 种 被 相继 描述 。 现 已 认识 的 病原 或 兼 性 病原 属 、 种 的 数量 在 不 断 增 加 。 

没有 系统 学 这 门 科学 ,就 不 可 能 取得 对 付 这 些 疾病 的 进展 .系统 学 家 能 够 认识 .区 分 并 说 明 影响 
人 类 健康 的 非 病 原 体 及 病原 体 的 特征 .这 些 生物 有 数 十 万 个 种 和 上 百 万 个 品系 ,其 中 包括 细菌 、 病 毒 、 
真菌 .酵母 菌 、 原 生动 物 、 线 虫 .由 虫 . 扁 虫 . 丝 虫 .昆虫 . 昌 、 螨 、 蜂 蛛 、 蝎 .蜗牛 等 .仅仅 了 解 可 能 引发 疾 
病 的 生物 这 还 不 够 ,我 们 还 要 把 一 个 类 群 中 的 所 有 已 知 物种 区 别 开 来 ,以 便 加 强 对 新 发 现 物种 的 了 
解 ,确定 某 个 已 知 的 品系 或 物种 本 为 非 病 原 体 是 否 已 转变 成 病原 体 ( 见 专栏 1)。 

掌握 致 病 生 物 的 进化 关系 对 提高 人 类 健康 水 平 同样 起 着 关键 的 作用 .通过 研究 疾病 载体 及 相关 
的 非 疾病 载体 的 相似 性 , 便 能 预测 致 病 生 物 的 变化 趋势 和 发 现 新 的 病原 型 。 由 于 爱滋病 导致 的 免疫 率 
乱 患者 人 数 不 断 增加 ,而 人 类 又 能 够 移植 器 官 、 医 治 重度 烧伤 和 延长 老人 及 瘤 症 患者 的 生命 ,因而 , 即 
使 是 最 无 毒 的 细菌 和 病毒 也 有 可 能 危及 生命 的 安全 .尽管 人 们 有 抗生素 疫苗、 良好 的 卫生 条 件 和 安 
全 的 食品 ,但 是 许多 传统 的 疾病 正在 复活 ,一 些 前 所 未 有 的 疾病 正在 出 现 。 大 量 曾 一 度 被 认为 是 非 病 
原 体 的 物种 ,目前 已 经 从 人 类 病例 中 被 分 离 出 来 .事实 证 明 , 掌 握 全 部 生物 类 和 群 的 进化 关系 及 地 理 分 
布 知识 ,对 于 了 解 病原 体 由 动物 转 至 人 类 的 过 程 和 发 现 某 些 病原 种 比 其 他 种 毒性 更 强 的 原因 起 着 关 
键 的 作用 。 

*。201。 


“如 果 认 为 我 们 必须 在 服侍 人 类 和 服侍 环境 之 间作 出 选择 的 话 , 那 我 们 就 犯 了 一 个 危险 的 错误 。 
两 个 目标 的 统一 必须 当 作 一 个 首要 问题 来 对 待 , 二 者 不 能 也 绝对 不 能 分 离开 来 。” 


—Orville Freeman, 


美国 前 农业 部 长 ,1989 年 


物种 的 利用 给 全 球 经 济 带 来 了 价值 数 万 亿美 元 的 效益 。 随 着 越 来 越 多 的 国家 编目 、 研 究 并 提出 对 


本 国境 内 多 样 性 的 权利 时 ,关于 物种 的 利用 和 管理 的 国际 协议 和 条 约 逐 渐 在 受到 重视 。 发 现 和 描述 的 . 


物种 越 多 ,对 其 分 布 及 与 别 的 物种 间 的 关系 了 解 得 越 详尽 ,那么 这 些 物 种 对 一 个 国家 的 经 济 能 作出 的 
贡献 就 越 大 ,这 些 物 种 能 给 后 代 保 存 下 来 的 就 越 多 .2000 年 系统 学 议程 所 确定 的 研究 任务 已 经 为 获得 
这 些 重要 的 知识 制订 了 计划 。 

历史 表明 ,新 种 的 发 现 以 及 随后 的 特性 研究 ,往往 会 带 来 重大 的 经 济 效益 .系统 学 分 析 ,包括 物种 
间 已 研究 认识 的 特性 的 比较 ,从 而 能 够 推测 新 种 的 特性 : 反 过 来 ,这 些 推测 又 能 更 有 效 、 更 可 靠 地 评定 
这 些 新 种 的 潜在 经 济 价值 。 


By 物 


据 世 界 卫生 组 织 统计 ,人 类 为 药 用 目的 而 利用 的 植物 有 两 万 多 种 .事实 上 ,发 展 中 国家 有 80%% 的 
人 仍然 依靠 传统 药物 作为 主要 的 疾病 治疗 (手段 ) 这些 药物 大 部 分 来 自 野 外 采集 的 植物 ,给 这 些 物 种 
的 很 多 野生 种 群 带 来 了 很 大 的 压力 。 


专栏 1 


疙 疾 与 系统 学 : 既 救 命 又 省 钱 


没有 遵循 寄生 虫 及 其 传播 媒介 的 准确 的 系统 学 知识 而 制定 的 疾病 控制 措施 ,只 会 造成 时 间 和 人 金 
钱 的 浪费 。 闪 疾 就 是 一 例 。 
JE PR HE Plasmodium 属 的 寄生 原生 动物 引起 的 。 在 该 属 四 个 会 侵 染 人 体 的 物种 中 ,PlLaszzodzzzz 


falciparum 造成 死亡 或 病态 的 危害 最 大 , 它 通过 蚊子 叮咬 而 传染 给 兰 椎 动物 。 能 携带 寄生 虫 的 蚊子 | 


的 种 类 很 多 ,但 它们 的 分 布 和 传播 能 力 各 不 相同 。 据 世界 卫生 组 织 估计 ,全 世界 并 疾 患者 每 年 有 2 一 3 


亿 例 ,大 约 一 百 万 例 患 者 因 病 死亡 ,其 中 多 数 为 儿童 。 

六 十 年 代 , 许 多 科学 家 都 在 从 事 Anopheles gambiae 这 种 分 布 于 非洲 的 主要 传播 媒介 的 杀 虫 剂 
抗 性 研究 . 几 十 个 品系 被 送 到 伦敦 进行 杀 虫 剂 和 杂交 试验 ,以 确定 其 抗 性 遗传 模式 。 大 量 的 杂交 种 不 
能 再 生育 .在 研究 过 程 中 ,系统 学 家 发 现 一 个 被 认为 是 4. gambiae 的 种 实际 上 是 六 个 不 同 的 种 ,其 
生物 学 特性 和 闪 疾 传播 能 力 显 然 各 不 相同 。 类 似 情 况 在 蚊子 中 还 重复 出 现 过 。 美 国 的 Anopheles 
quadrimaculatus, E\ FEW A. culicifacies 和 泰国 的 A. dirus 均 被 证 明 是 种 的 复合 体 ( 即 不 仅仅 是 一 个 
物种 ) ,它们 传播 洗 疾 的 能 力 各 不 相同 。 


“美国 药店 开 出 的 所 有 药方 中 ,四 分 之 一 是 从 植物 中 提取 的 物质 ,13% 来 自 微生物 ,另外 3 儿 强 来 
自动 物 .也 就 是 说 ,40 儿 以 上 的 药 来 源 于 生物 .然而 ,这 些 药物 只 不 过 占 众 多 可 利用 中 的 极 小 部 分 。 


—E. O. Wilson, ，1992 年 ,第 283 一 285 页 


实践 证 明 ,在 筛选 有 药 效 的 成 分 时 ,如 果 选 用 传统 药物 所 利用 的 物种 ,其 成 功 机 遇 比 选用 同一 地 
区 中 植物 随机 抽样 要 大 得 多 。 人 类 利用 动物 和 植物 的 能 力 , 是 各 地 人 民 与 自然 界 密切 相处 ,在 长 期 的 
实践 .失败 过 程 中 经 过 不 断 总 结 形成 的 。 专 长 于 民族 生物 学 , 即 研究 人 们 利用 土生 土 长 动 植 物 的 系统 
学 家 对 这 些 重 要 经 济 物种 的 描述 和 研究 起 着 主要 作用 .开展 人 类 利用 的 动物 .植物 和 微生物 的 民族 生 
物 学 综合 调查 迫在眉睫 .记载 传统 人 类 社会 与 为 其 所 用 的 动 植 物 间 的 关系 ,包括 种 质保 护 , 是 系统 民 
族 生 物 学 的 一 个 重要 研究 领域 。 

分 类 系统 的 创造 是 系统 民族 生物 学 的 一 个 最 重要 的 贡献 .系统 民族 生物 学 的 民族 生物 区 系 遗 传 
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多 样 性 的 大 部 分 科研 工作 ,如 保存 .保护 .育种 .有 用 基因 的 探索 .生物 技术 等 ,都 随 着 近 缘 关系 的 决定 
而 定 的 。 研 究 成 果 多 以 分 类 、 分 类 学 专著 或 系统 发 育 分 析 的 形式 在 科学 界 交流 。 这 些 研 究 可 提供 基础 
的 生物 学 信息 ,如 物种 分 布 、 结 构 变 异 等 ， 它们 对 驯化 种 和 野生 近 缘 种 的 研究 有 者 关键 的 作用 。 许多 发 
现 新 药 的 例子 也 可 以 说 明 系 统 民族 生物 学 的 重要 性 ( 见 专栏 2)。 

世界 上 用 有 花 植物 制造 的 药物 产值 达 数 十 亿美 元 。 然 而 这 项 财富 大 多 数 仅 来 自 一 小 部 分 物种 .与 
25 万 种 有 花 植物 相 比 ,微生物 具有 更 大 的 多 样 性 ,它们 很 可 能 是 药物 和 其 他 生物 技术 产品 的 重要 来 源 
(Bull 等 ,1992) 。 微 生物 药 中 最 著名 的 例子 是 由 Penazczllizzxz notatum 生产 的 盘 尼 西林 , 它 给 治疗 传染 病 
的 药物 带 来 了 一 场 革命 。 

寻找 微生物 来 源 新 药 的 工作 才刚 开展 。 微 生物 的 系统 发 育 和 分 类 能 促进 对 它们 相互 间 关 系 的 认 
识 , 这 为 筛选 自然 界 的 大 量 物种 提供 了 可 预测 的 线路 图 .因此 ,系统 学 知识 对 微生物 新 药 的 发 现 具有 
不 可 估量 的 作用 .遗憾 的 是 ,人 们 对 微生物 尤其 是 病毒 .细菌 和 真菌 的 系统 学 了 解 甚 少 , 上 百 万 的 物种 
仍 有 待 发现 和 描述 ,多 数 类 群 间 的 关系 仍 有 竺 分析. 此 外 ,研究 许多 微生物 类 群 的 系统 学 家 也 不 断 减 
少 。 这 种 状况 如 不 改变 ,人 类 便 会 失去 发 展 经 济 和 技术 的 许多 良机 (Hawksworth 和 Ritchie 1993), 


RE 
系统 民族 生物 学 与 新 药 的 发 现 :马达 加 斯 加 的 几 个 例子 


马达 加 斯 加 这 个 陆地 岛屿 上 有 1 万 3 千 多 种 植物 . 令 人 人 惊奇 的 是 ,这 个 岛屿 上 80%% 的 植物 都 是 特 
有 种 。 通 过 研究 这 些 特 有 种 及 其 在 当地 医疗 体系 中 的 作用 而 开发 的 新 药 不 胜 枚 举 。 
K # 4€ (Catharanthus rosexs) 是 其 中 最 著名 的 一 个 例子 .不 久 以 前 , 它 还 仅仅 是 人 们 花园 中 的 一 
种 观赏 植物 .当地 不 少 人 把 它 当 作 一 种 民间 草药 来 治疗 糖尿 病 , 于 是 人 们 对 它 进一步 研究 ,以 期 从 中 
找到 口服 胰岛 素 的 代用 品 。 虽 然 玫 瑰 红 草 长 春花 在 治疗 糖尿 病 方面 的 效用 尚未 得 到 证 实 , 但 它 的 提 
取 物 却 发 现 具有 大 幅度 减少 实验 动物 白血球 计数 和 抑制 骨髓 活动 的 功效 。 根 据 上 述 观 察 结 果 , 类 们 
终于 分 离 出 两 种 化 学 成 份 , 即 能 够 有 效 治 疗 白血病 的 长 春 碱 和 长 春 新 碱 . 自 从 这 种 药物 首次 进入 市 
场 以 来 ,儿童 白血病 的 治愈 率 由 过 去 的 10%% 提 高 到 现在 的 95% 。 
3e 7K JB (Rauwol fia) PA Bi FP, BY RE HB AR CR. serpentina) Al R. zoomzztorza ,它们 的 根 是 提取 几 种 
生物 碱 或 制作 根 粉 的 原材料 .这 些 产 品 的 药物 制剂 可 用 来 治疗 高 血压 ,也 可 用 作 治疗 精神 紊乱 的 镇 
静 剂 。 
cio 问题 是 灭绝 的 速度 上 升 得 如 此 之 快 ,以 至 于 如 果 人 们 找到 一 种 具有 特殊 生物 活性 的 植物 ， 
很 可 能 当 你 去 时 已 发 现 其 生境 全 然 无 存 。 这 是 一 场 时 间 战 争 .” 
Michael Balick 
纽约 植物 园 经 济 植物 研 究 所 所 长 


农 业 


”世界 农业 的 发 展 有 赖 于 农业 研究 带 来 的 技术 进步 。 从 世界 范围 看 ,发 达 的 农业 体系 正 朝 着 减少 杀 
虫 剂 、 化 肥 和 除草 剂 的 施用 量 ,加 强生 物 防 治 、 害 虫 综合 管 理 和 持续 性 农业 的 方向 发 展 *。 以 上 技术 强烈 
依赖 于 有 关 害 虫 类 群 、 害 虫 的 植物 寄主 及 害虫 天 敌 的 系统 学 知识 .系统 学 信息 是 农业 管理 的 语言 和 预 
测 基础 ,由 于 系统 学 信息 的 不 足 而 造成 搁浅 或 失败 的 项 目 多 不 胜 数 ( 见 专栏 3)。 

随 着 对 非 杀 虫 剂 防 治 策略 的 作用 的 不 断 重 视 , 需 要 了 解 在 农业 生态 系统 中 起 重要 作用 的 各 种 各 
样 的 生物 越 来 越 成 为 关键 问题 。 据 估计 ,有 用 的 生物 防治 因子 可 能 有 数 千 种 ,但 它们 均 未 被 科学 所 揭 
示 。 因 此 ,要 发 挥 它们 的 经 济 作用 ,就 必须 首先 发 现 和 描述 这 些 生物 ,并 把 它们 纳入 分 类 系统 和 信息 系 
统 。 如 果 有 一 些 生 物 , 它 们 在 农业 生态 系统 中 既 能 使 产量 提高 并 又 有 一 个 健康 的 环境 ,但 人 们 却 对 它 
们 尚未 认识 ,或 与 别 的 生物 混淆 不 清 , 或 与 其 他 物种 的 关系 不 明 ,农业 发 展 势 必 会 受到 极 大 的 阻碍 。 


es。 203 。 


系统 学 研究 节省 数 十 亿美 元 : 几 个 生物 防治 事例 


FE + Au tht 26 AR BA. HB Wt (cottony-cushion scale) 严 重 影响 了 加 利 福 尼 亚 的 柑 桔 产业 。 根 据 一 位 系 
统 学 家 提供 的 信息 ,在 澳大利亚 进行 国外 考察 ,结果 发 现 并 引进 了 一 种 以 吹 棉 晶 为 食 的 球 虫 ,从 而 控 
制 了 这 种 蛤 虫 的 危害 ,拯救 了 加 利 福 尼 亚 的 柑 桔 业 。 

许多 年 来 ,生物 防治 专家 一 直 没 有 找到 对 加 利 福 尼 亚 红 介壳 虫 有 效 的 天 敌 。 一 位 介壳 虫 专家 应 
邀 研究 这 种 昆虫 ,结果 发 现 它 实 际 上 是 三 个 不 同 的 相似 种 , 即 加 利 福 尼 亚 红 介壳 虫 、. 黄 蛤 和 紫 杉 明 。 
其 后 ,研究 寄生 蜂 的 系统 学 家 发 现 , 正 是 因为 鉴定 失误 才 难 以 找到 红 介 壳 虫 的 天 敌 。 不 久 , 各 种 成 功 
的 生物 防治 因子 相继 被 引入 。 

了 解 有 害 种 的 原 产地 往往 会 给 寻找 有 效 生 物 防 治 因 子 提 供 很 大 的 帮助 。 甜 菜 叶 蝉 CCzrculzyer 
tenellus) 早先 被 认为 是 Eutettix 属 的 一 个 种 , 原 产 南美 洲 。 遗 憾 的 是 ,人 们 在 南美 洲 不 仅 没 有 发 现 防 
治 因 子 ,还 浪费 了 大 量 的 时 间 和 精力 。 最 后 系统 学 家 发 现 该 种 其 实 属于 东 半 球 的 Circulifer 属 , 于 是 
便 在 地 中 海地 区 找到 了 几 种 有 效 的 天 敌 , 并 引入 加 利 福 尼 亚 。 

1974 年 , 扎 伊 尔 发 现 了 一 种 引进 的 粉 明 科 介壳 虫 。 这 种 害虫 每 年 给 西非 的 木薯 种 植 业 造成 近 14 
亿美 元 的 损失 。 这 种 介壳 虫 被 描述 为 物种 Phenacoccus maazhoi ,于 是 人 们 开始 在 南美 北部 寻找 它 的 
生物 防治 因子 。 在 没有 找到 任何 有 效 的 寄生 虫 后 ,一 位 粉 内 科 系统 学 家 又 重新 研究 ,结果 找到 了 一 个 
与 上 述 种 非常 相近 的 种 Pherrexz ,主要 见于 南美 北部 ,而 P. manihoti 实际 上 分 布 在 较 南 部 .有 了 这 
一 发 现 ,有 效 的 寄生 虫 便 很 快 被 找到 并 引入 非 洲 灾区 。 


外 来 害虫 的 侵入 对 世界 农业 生产 最 具 破坏 力 。 不 幸 的 是 ,国际 贸易 量 的 增长 和 交通 网 络 的 飞速 发 
展 增加 了 引入 新 害虫 的 可 能 性 大 多 数 国家 都 要 查验 人 境 的 商品 ,搜查 任何 外 来 的 传染 物 , 并 制定 相 
应 的 入 境 管理 规定 .这些 措施 基本 上 依赖 于 系统 学 家 提供 的 信息 ,因为 任何 一 个 国家 都 不 可 能 有 完整 
的 所 有 物种 的 编目 ,也 不 可 能 完全 了 解 某 种 被 查获 的 生物 是 否 分 布 于 本 国 。 再 者 ,多 数 重要 的 农业 类 
群 大 都 确 乏 详尽 的 鉴定 材料 .缺乏 某 一 害虫 类 群 的 系统 学 信息 有 时 还 会 产生 一 些 特殊 问题 ,例如 , 烟 
草 菠 蠕 虫 (budworm) 往 往 见于 来 自 中 美和 南美 的 查获 商品 。 芽 蠕虫 一 直 被 认为 只 有 三 个 种 ,但 近期 专 
项 研究 表明 ,其 复合 体 由 十 二 个 不 同 的 型 组 成 。 

各 个 国家 也 必须 制定 若干 规定 ,以 限制 从 某 些 国家 进口 某 些 特殊 的 农业 产品 .这 些 规定 都 必须 以 
系统 学 知识 为 依据 ,同时 也 要 依靠 本 国 对 原 产 国 商品 中 出 现 的 所 有 植 食性 生物 .它们 是 否 有 害虫 的 潜 
势 以 及 世界 分 布 的 了 解 程度 ( 见 专栏 4) 。 

由 于 缺乏 足够 的 系统 学 知识 ,尤其 是 关于 有 害 物种 的 系统 学 知识 ,制定 这 些 重要 规定 的 科学 依据 
往往 不 足 。 


系统 学 信息 与 农产品 贸易 


从 某 种 情况 上 讲 ,掌握 有 潜在 危害 的 生物 的 系统 学 知识 可 为 增加 商品 的 出 口 量 和 避免 严重 国际 
贸易 事件 发 生 铺 平 道 路 .举例 说 明 ,加 拿 大 从 美国 进口 的 小 麦 中 带 有 一 种 黑 粉 菌 , 这 种 菌 最 初 被 鉴定 
为 Neovossia indica , 一 种 极其 危险 的 外 来 病原 体 。 为 此 ,加 拿 大 作出 禁止 从 美国 进 口 小 麦 的 禁令 。 经 
二 位 系统 学 家 研究 这 种 病菌 ,最 终 认 定 是 一 种 常见 于 大 米 的 物种 Tilleiia parclayaxa, 并 且 早 在 小 麦 
运 到 同一 仓库 之 前 就 已 存在 , 正 是 由 于 这 项 极 小 的 系统 学 发 现 ,一 场 可 能 造成 重大 经 济 损失 的 国际 
事件 才 得 以 平息 。 


在 过 去 ,农业 项 目 提 倡 使 用 杀 虫 剂 和 化 肥 ,常常 给 环境 带 来 不 利 影响 .而 在 当今 , 随 着 害虫 管理 和 
生物 防治 等 低 环 境 影响 策略 的 出 台 , 作 物种 质 需要 重新 发 掘 。 这 项 工作 要 求 详 细 地 了 解 世 界 珍贵 的 农 
“204。 
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物 的 基因 移植 到 另 一 种 生物 ,因此 ,保持 物种 多 样 性 变 得 尤其 重要 ,因为 任何 生物 的 遗传 材料 都 可 能 
有 益 于 农业 体系 。 系 统 学 知识 则 能 使 科学 家 更 好 地 了 解 作 物 的 抗 病情 况 ,从 而 在 特定 情况 下 选用 最 佳 
的 遗传 原 种 ( 见 专栏 5)。 


专栏 5 
系统 学 发 现 与 作物 改良 :两 个 事例 


玉米 

1977 年 ,一 位 叫 Rafael Guzman 的 墨西哥 植物 系统 学 家 重新 发 现 了 (在 两 块 玉米 大 田间 的 水 渠 
HAG AM Zea perexzzs ,一 种 珍贵 的 多 年 生 玉 米 草 , 即 野 玉 米 。Zea perennis 是 人 类 三 种 最 主要 农 
作物 (其 他 两 种 为 水 稻 和 小 麦 ) 之 一 的 玉米 (Zea mays) 的 一 个 近 缘 种 .不 久 以 后 ,Guzman 又 在 附近 山 
区 的 云雾 林 中 发 现 了 这 种 多 年 生 玉 米 草 的 另外 一 个 种 ,并 把 种 籽 送 给 玉米 系统 学 家 Hugh lltis 和 
John Doebley 研究 .这 些 种 籽 所 产生 的 植物 结果 是 一 个 鲜 为 人 知 的 种 Z. diploperennis, 5 Z. peren- 
nis 不 同 的 是 ,这 种 玉米 的 染色 体 数目 与 家 种 玉米 恰好 相同 ,很 容易 与 家 种 玉米 杂交 。 更 令 人 感到 惊 
奇 的 是 ,Z._ diploperennis 可 以 抵抗 家 种 玉米 (Z. mays) 常 见 的 七 种 病毒 病 , 同 时 某 些 对 病毒 的 抗 性 
目前 可 以 移植 到 家 种 玉米 .迄今 为 止 , 已 经 有 四 个 抗 病毒 玉米 品种 进行 了 商业 性 种 植 . 世 界 玉米 的 年 
产值 近 600 亿 美元 ,这 项 发 现 的 潜在 经 济 价值 可 见 一 斑 。 

上 述 事例 的 另 一 方面 也 值得 引起 人 们 的 重视 。 这 个 新 种 发 现 于 生物 多 样 性 丰富 的 墨西哥 西南 部 
地 区 ,但 是 森林 砍伐 、 牧 业 和 农业 正在 迅速 破坏 着 这 个 地 区 的 森林 。 如 果 不 是 Sierra de Manantlan #% 
个 山区 被 确定 为 生物 圈 保 护 区 ,这 种 珍贵 植物 所 剩 的 几 个 种 群 现在 可 能 已 经 绝 灭 .还 有 ,新 种 的 发 现 
者 如 果 不 是 一 位 杰出 的 草本 植物 系统 学 家 ,或 者 他 没有 把 种 籽 送 给 分 类 困难 的 Zea 属 方面 的 专家 ， 
这 一 珍稀 物种 或 许 就 会 为 人 们 所 忽略 .以 上 事实 进一步 说 明了 培养 一 大 批 优 秀 的 系统 学 家 ,增强 探 
索 、 记 录 和 保存 世界 上 现存 生物 区 系 多 样 性 力量 的 重要 作用 。 


著 匣 


1962 年 ,Hugh Iltis 和 Don Ugent 在 安第斯 山 探险 时 采集 到 一 千 多 号 植物 标本 ,包括 一 个 野生 番 
茄 新 种 的 种 籽 。 新 种 与 家 种 番茄 杂交 后 ,可 增加 杂种 果实 的 可 溶性 固体 含量 .这 项 成 果 每 年 可 为 番茄 
种 植 业 创造 800 万 美元 的 效益 。 


林 业 


美国 的 林地 面积 有 230 万 英亩 。 虽 然 木 材 产品 的 产值 高 达 1360 亿 美元 ,与 其 相 比 , 林 副 产品 及 娱 
乐 ` 水 资源 等 非 商品 利用 所 创造 的 价值 则 要 更 大 些 。 随 着 人 们 对 森林 价值 认识 的 转变 ,森林 管理 出 现 
了 重大 的 变革 。 新 型 的 管理 哲学 促使 人 们 去 保护 老龄 林 , 并 寄 更 大 希望 于 非 木 材 物 种 。 与 传统 的 森林 
管理 方式 相 比 ,森林 的 长 期 管理 面临 着 一 连 串 的 问题 .尽管 大 多 数 森林 管理 者 能 够 测定 森林 物理 和 化 
学 性 状 ,监测 动 植物 区 系 变化 ,但 他 们 仍然 缺乏 衡量 森林 系统 生物 多 样 性 的 专门 知识 .有 限 的 无 脊椎 
动物 及 微生物 系统 学 知识 使 森林 濒临 险 境 ,在 控制 引进 的 有 害 节肢 动物 和 病原 体 方面 尤其 如 此 。 例 
如 ,1992 年 不 列 颠 哥伦比亚 发 现 了 一 种 奇异 的 昆虫 。 由 于 没有 这 方面 的 专家 ,等 鉴定 出 这 种 可 怕 的 外 
来 甲虫 Bu ptestis hemmoradialis 时 已 经 过 了 一 年 的 时 间 。 在 此 期 间 , 这 种 昆虫 已 经 过 了 两 个 生长 季节 。 
这 么 一 来 ,本 来 可 以 在 小 范围 内 采取 的 灭 杀 措施 ,只 好 扩展 到 大 范围 内 进行 。 像 这 样 的 时 间 耽 搁 不 仅 
降低 了 灭 虫 效果 ,而且 还 增加 了 灭 虫 的 经 费 开 支 。 


渔 业 


渔业 产品 是 世界 上 和 蛋白质 的 主要 来 源 (Norse 1993) .因此 ,区 分 普通 鱼 类 和 具 商 业 价 值 的 海味 对 
自然 资源 管理 和 为 水 产 养 殖 物 种 的 选择 有 着 重要 的 作用 ( 见 专栏 6)。 此 外 系统 学 信息 在 国内 法 及 国际 
法 规 , 条 约 和 公约 的 执行 等 政策 问题 上 也 同等 重要 。 


“OO 


非 本 地 种 的 引进 极 有 可 能 给 水 生生 境 带 来 严重 的 危害 .人们 往往 认为 一 些 外 来 种 有 益 而 故意 将 
其 引入 ,不 料 后 果 最 为 严重 。 不 少 水 生物 种 通过 栖 居 船体 或 水 舱 而 无 意 被 引入 .这些 引进 的 物种 大 部 
分 会 在 经 济 上 给 土生 种 带 来 严重 的 损失 .再 则 ,引进 种 还 会 携带 许多 寄生 虫 和 病原 体系 统 学 的 研究 
对 准确 鉴定 引进 种 及 其 寄生 虫 和 病原 体 有 着 不 可 磨灭 的 贡献 ,是 制定 有 效 管理 策略 的 理论 基础 。 


系统 学 研究 提高 渔业 产量 :两 个 事例 


正确 鉴定 目标 物种 把 系统 学 与 渔业 也 联系 到 了 一 起 .太平 洋 东 北部 的 狭 鳃 (T7Heragra 
chnalcosgrazz7z4) 捕 捞 业 是 世界 上 最 大 、 创 造 经 济 价值 最 高 的 捕捞 对 象 之 一 .至 二 十 世纪 八 十 年 代 , 狭 
鳃 已 经 成 为 世界 渔业 中 捕捞 量 最 大 的 鱼 种 .然而 , 狭 鳃 只 不 过 是 东北 太平 洋 地 区 几 种 近 缘 鱼 类 中 的 
一 种 ,不 和 久 前 其 早期 生活 史 还 鲜 为 人 知 ,部 分 原因 在 于 其 幼体 的 野外 样品 难 与 其 他 鱼 类 难以 辨别 。 在 


过 去 的 十 年 中 ,系统 学 的 研究 结果 突破 了 这 一 难关 ,能 够 准确 地 分 辨 出 不 同 的 幼体 ,使 得 通过 增加 幼 
体 数量 提高 可 捕捞 鱼 类 产量 之 计划 得 以 实施 .系统 学 家 还 通过 随 船 服务 和 举办 管理 人 员 分 类 培训 
班 ,为 这 项 捕 拓 业 提供 后 续 服 务 。 

要 维持 和 扩大 鱼 类 可 捕捞 种 群 的 规模 ,准确 无 误 的 系统 学 信息 必 不 可 少 。 例 如 ,有 关 西 班 牙 铺 的 
数据 都 以 巴西 种 群 为 根据 ,渔业 人 员 最 初 打算 利用 这 一 信息 来 管理 墨西哥 湾 和 美国 东海 岸 的 种 群 。 
然而 系统 学 研究 证 明 , 巴 西 种 群 为 本 brasiliensis ,与 北美 种 群 ,Scoxzperomzozrzs maculatus 截 
然 不 同 。 由 于 两 个 种 的 生物 学 特性 各 异 , 像 南方 种 那样 进行 管理 很 可 能 会 导致 失败 。 


了 解 和 保护 地 球 的 生命 支持 系统 


地 球 表面 的 环境 与 有 生命 的 生物 间 的 关系 十 分 密切 ,并 随时 间 的 推移 而 改变 。 地 球 上 数 百 万 的 物 
种 不 仅 相互 关联 ,与 周围 的 环境 也 息息相关 ,最 终 形成 了 一 个 维持 生命 存在 的 错综复杂 的 生态 网 络 。 
这 种 关系 的 产物 免费 为 我 们 提供 了 清洁 的 空气 .水 .肥沃 的 土壤 及 调节 地 球 的 地 球 化 学 循环 (基本 上 
通过 微生物 作用 完成 ) 。 绿 色 植 物 能 吸收 太阳 的 能 量 , 并 把 能 量 转化 给 别 的 生物 .世界 上 的 植被 特别 是 
热带 雨林 再 把 水 循环 到 大 气 , 从 而 控制 着 气候 的 变化 。 

随 着 人 口 的 暴涨 及 全 球 变化 的 加 快 ,地 球 的 生命 支持 系统 日 益 受 到 威胁 .人 类 从 世界 自然 资源 获 
取 食 物 、 住 房 \ 衣 物 和 燃料 的 同时 ,也 给 环境 带 来 了 严重 的 影响 , 像 森林 大 面积 砍伐 .空气 污染 \ 水 污 
染 、 全 球 变 暖 等 。 

系统 学 的 知识 在 监测 这 种 全 球 变化 方面 起 到 最 基本 的 作用 .收藏 的 标本 是 生物 群落 和 生态 系统 
变更 的 见证 ,记载 着 长 时 间 内 环境 对 所 受 压 力 的 反应 。 同 样 是 这 些 标本 ,由 于 包含 不 同 的 物种 存在 和 
鉴定 的 基本 科学 证 据 , 因 此 也 是 物种 灭绝 的 最 可 靠 记 载 . 对 下 个 世纪 物种 灭绝 的 推测 ,主要 依靠 森林 
砍伐 和 生境 破坏 方面 的 综合 信息 .没有 物种 存在 和 分 布 的 有 完整 记录 的 科学 知识 ,就 没有 生态 变化 和 
物种 灭绝 的 准确 评估 .只 有 系统 学 才能 可 靠 地 衡量 生物 多 样 性 的 危机 程度 。 

另 一 方面 ,正确 鉴定 物种 对 监测 全 球 变化 也 十 分 重要 .所 有 的 生物 群落 都 包含 一 些 对 环境 变化 特 
别 敏感 的 物种 。 比 如 , 某 些 蛙 类 对 空气 质量 的 变化 异常 敏感 ;在 水 生 群 落 中 , 某 些 鱼 类 对 水 纯度 变化 十 
分 敏感 .为 此 ,科学 家 已 越 来 越 多 地 利用 这 些 指示 种 来 考察 全 球 变化 对 自然 群落 的 影响 ,从 而 实现 监 
测 全 球 变化 的 目的 。 只 有 准确 鉴定 和 描述 这 些 物种 ,掌握 其 分 布 及 近 缘 种 的 知识 ,才能 够 开展 这 些 监 
测 活动 。 

世界 上 许多 生境 和 生态 系统 都 生活 着 成 千 上 万 的 有 着 极其 复杂 作用 关系 的 物种 .生态 学 家 和 资 
源 管 理 人 员 进 行 这 些 相互 关系 的 动态 研究 时 ,由 于 对 即使 是 最 普通 物种 的 鉴定 和 分 布 的 认识 都 还 存 
在 着 缺陷 ,这 些 生境 和 生态 系统 的 基本 描述 当然 不 可 能 全 面 。 这 就 要 求 开 展 深 入 的 系统 学 研究 ,描述 
和 鉴定 地 球 众 多 生态 群落 中 生存 的 物种 .这些 信 息 对 提供 评定 环境 压力 所 依据 的 基 低 数据 至 关 重 要 。 

系统 学 对 自然 资源 的 管理 和 保护 同样 有 重要 作用 。 保 护 区 生物 多 样 性 的 保护 管理 人 员 需 要 对 物 
种 作 鉴 定 并 了 解 其 地 理 分 布 , 为 有 效 管 理 策略 的 制定 和 实施 提供 依据 .系统 学 则 为 物种 的 鉴定 多样 
性 的 评价 以 及 需要 特别 保护 的 物种 的 确定 提供 了 理论 基础 .此 外 ,系统 学 信息 与 保护 区 和 开发 区 的 选 
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址 和 规划 .它们 与 地 方 和 国家 法 规 的 关系 的 评估 ,都 有 着 紧密 的 联系 。 有 效 管理 动 植物 国际 贸易 也 同 
样 需要 精确 的 系统 学 资料 这些 资料 还 直接 有 利于 一 些 像 濒危 野生 动 植物 种 国际 贸易 公约 (CITES) 
的 国际 性 条 约 和 公约 的 执行 和 实施 。 


提高 日 常生 活 的 质量 


生物 的 多 样 性 有 助 于 我 们 去 理解 人 类 意识 和 智力 的 某 些 方面 。 对 自然 环境 的 宁静 和 舒适 的 追求 
是 人 类 的 共性 ,这 就 是 许多 宗教 道德 文化 为 什么 具有 保护 和 尊敬 自然 环境 信仰 的 原因 .人 类 能 够 使 其 
他 物种 灭绝 ,而 在 伦理 道德 上 ,人 们 普遍 认为 应 肩负 起 阻止 这 种 悲剧 发 生 的 责任 。 这 正 像 Ehrlich 和 
Ehrlich (1992 ,第 220 页 ) 指 出 的 那样 ， 我 们 认为 ,如 果 大 多 数 人 没有 保护 生物 多 样 性 的 观念 ,那么 这 个 
问题 就 不 可 能 得 到 解决 。 

纵 观 人 类 历史 ,人 对 其 他 物种 显示 出 极度 的 好 奇 心 , 并 为 其 美学 价值 所 倾倒 。. 人 类 与 自然 的 这 种 
联系 在 所 有 民族 中 普遍 存在 ,并 体现 于 对 其 他 物种 的 态度 ,尤其 是 园艺 业 、 宠 物 饲 养 .野生 动物 和 鸟 的 
观赏 等 活动 之 中 。 对 其 它 物种 的 美学 和 情感 依托 的 同时 ,还 为 许多 人 创造 了 巨大 的 经 济 效益 ,尤其 在 
自然 旅游 和 标本 贸易 这 两 个 方面 。 

旅游 业 每 年 创造 的 价值 达 2500 亿 美元 。 如 果 把 观赏 其 他 物种 连带 的 旅行 活动 计 和 人 在 内 ,上 述 收益 
中 有 将 近 20%% 来 源 于 生态 或 自然 旅游 .不 少 国家 国民 生产 总 值 的 大 部 分 或 部 分 来 自生 态 旅游 ,其 中 单 
是 某 些 物种 就 创造 了 巨额 收入 .例如 在 东非 ,肯尼亚 Amboseli 公园 的 一 头 狮子 十 五 年 内 可 创汇 50 万 
美元 ,所 有 的 非洲 象 每 年 创汇 60 万 美元 。 如 果 计 人 此 类 自然 区 域 各 项 配套 产业 的 盘 利 ,这 项 收入 在 全 
世界 可 达 几 百 亿美 元 ( 见 专栏 7) 。 


专栏 7 
系统 学 与 生态 旅游 


系统 学 研究 对 生态 旅游 业 的 贡献 重大 .系统 学 方面 的 出 版 物 ,例如 修订 版 .图解 专著 、 纺 目 、 标 
本 等 ,为 野外 向 导 、 旅 行 向 导 、 电 影 、 录 像 、 录 音 及 其 他 宣传 手段 提供 了 科学 的 背景 材料 。 
上 千年 来 ,人 类 不 论 生 存在 哪里 ,都 始终 和 其 他 物种 的 驯化 种 植 打 着 交道 .当今 驯养 和 栽培 的 


动 植 物 已 有 几 万 种 ,其 繁殖 和 贸易 的 商业 价值 有 几 十 亿美 元 (CGroombridge 1992) 。 举 例 说 明 , 仅 英 国 
就 栽培 有 3000 多 种 用 作 装 饰 的 植物 ;全 世界 有 贸易 记录 的 兰花 种 类 超过 5000 种 .从 国际 商业 范 栈 来 
讲 , 像 鸟 类 、 疏 行 动物 、 蛙 类 、 热 带鱼 类 、 蝴 蝶 、 最 蛛 等 动物 的 出 口 每 年 可 创造 几 亿美 元 的 效益 。 系 统 学 
对 监测 和 管理 世界 自然 资源 的 重大 作用 表现 在 它 提 供 了 准确 的 识别 材料 图解 以 及 物种 分 布 信息 。 
世界 上 大 量 的 动 植物 贸易 对 其 自然 种 群 产 生 了 极 大 的 压力 ,尤其 是 从 野外 直接 猎取 。 由 于 许多 物种 
形态 的 相似 ,因此 ,有 效 地 监测 物种 和 执行 法 律 必须 依靠 物种 的 准确 鉴别 。 


加 强 科学 研究 


系统 学 构 画 了 一 个 总 体 框架 ,使 生物 学 的 研究 成 果 在 这 个 框架 内 得 以 整理 和 交流 。 比 较 两 个 或 两 
个 以 上 物种 的 生物 学 研究 ,或 针对 某 一 物种 但 其 研究 成 果 最 终 会 被 对 其 它 种 有 兴趣 的 生物 学 家 考虑 
的 生物 学 研究 ,都 或 多 或 少 地 借鉴 系统 学 的 研究 结果 .系统 学 研究 的 结果 对 选择 研究 系统 和 评价 一 些 
有 意义 的 生物 学 现象 的 普遍 性 也 有 重要 的 作用 。 

通过 分 析 物 种 关系 而 产生 的 系统 发 育 树 包 含 着 对 血统 (共同 祖先 )、 长 期 的 特征 变化 及 地 理 分 布 
(历史 生物 地 理学 ) 变 化 的 假设 .理论 上 讲 ,在 演化 世代 期 所 发 生 的 所 有 生物 学 变化 都 能 在 系统 发 育 树 
中 体现 出 来 .近年 来 ,由 系统 学 家 提出 来 的 以 系统 发 育 假设 为 依据 的 严 廊 的 比较 研究 法 得 到 了 发 展 ， 
用 来 研究 和 解释 一 系列 生物 学 现象 ,例如 寄生 物 及 寄主 的 生物 地 理学 和 协同 进化 ,生态 学 和 行为 学 的 
历史 变迁 等 (Brooks 和 McClennan 1991) .与 此 同时 ,系统 发 育 假设 也 成 为 研究 适应 、 物 种 形成 、 灭 绝 
等 基本 进化 过 程 的 理论 基础 。 


2000 年 系统 学 议程 的 任务 


2000 年 系统 学 议程 
制订 生物 圈 计 划 


系统 学 知识 的 基本 用 户 : 
1. 物种 的 发 现 和 编目 =a . 医疗 和 保健 
预测 性 分 类 和 数据 库 
2 比较 物种 并 推测 LUTE SSA . 生物 技术 
系统 发 育 史 ye . 农业 和 渔业 
3. 利用 系统 发 育 及 由 . 林产 工业 
此 产生 的 分 类 来 结 学 知识 | Le . 保护 及 资源 管理 者 
合 基础 和 应 用 生物 学 . 生态 旅游 
4. 提供 可 持续 利用 生物 . 基础 生物 科学 
多 样 性 的 基本 数据 


第 一 项 任务 :全球 物 种 多 样 性 的 发 现 . 描 述 和 编目 


生物 圈 物 种 的 发 现 . 摘 述 和 编目 是 人 类 用 智慧 管理 生物 圈 的 一 个 重要 贡献 .由 于 许多 物种 过 于 微 
小 ,其 研究 十 分 困难 ,造成 世界 各 地 生物 多 样 性 的 了 解 甚 少 。 璧 如 说 ,世界 上 任何 一 处 普通 庭院 都 生存 
有 许多 物种 ,将 这 些 物 种 逐一 列 出 几乎 不 大 可 能 ,更 何况 比 它 复杂 得 多 的 生态 系统 。 

迄今 为 止 , 系 统 学 家 大 约 已 经 描述 了 140 万 种 生物 ,其 中 大 部 分 是 昆虫 。 据 推测 ,尚未 发 现 和 描述 
的 物种 仍 有 1 千 万 到 一 亿 种 ( 见 专栏 8)。 ， 

有 待 了 解 的 物种 的 数量 多 得 如 此 令 人 吃惊 ,这 似乎 又 与 我 们 在 日 常生 活 中 所 接触 到 的 少数 树木 、 
哺乳 动物 、 鸟 类 、 蝴 蝶 及 其 他 常见 物种 大 有 出 人。 那么 就 去 想象 一 下 大 片 的 雨林 ,那里 仅 在 一 棵 树 上 就 
能 发 现 几 百 种 昆虫 ,在 一 小 块 森 林 就 生存 有 几 百 个 不 同 的 树种 , 仅 在 几 立 方 英尺 的 土壤 和 地 表 腐 叶 中 
就 会 生活 着 上 千 种 微小 的 螨 、 线 虫 \ 真 菌 和 微生物 。 
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物种 数量 知 多 少 ? 几 个 事例 


已 描述 物种 的 数量 《有 竺 发 现 物种 的 估量 
ST 约 50 万 
a 40— 30077 
7A 100—150 Jr 
4 万 10— 70% 
4 万 20781 = TF 
post 30— 5077 
sp] 
50—1004 
204 
1573 
75—10037 
8004 —14Z 
5| A Groombridge(1992) 


人 类 对 全 球 环境 造成 的 压力 ,迫切 要 求 尽快 掌握 世界 生物 多 样 性 的 知识 。 这 项 工作 要 求 我 们 加 大 
探索 地 球 的 力度 ,汇集 这 些 物 种 的 样本 ,仔细 分 析 发 现 的 标本 ,以 准确 判断 它们 与 已 知 物 种 的 区 别 。 要 
实现 此 项 目的 ,就 必须 支持 对 地 球 生境 开展 综合 性 的 考察 和 编目 以 及 对 收藏 标本 的 研究 工作 。 今 后 的 
几 十 年 中 ,地 球 五 分 之 一 之 多 的 物种 行将 灭绝 ;但 目前 对 全 球 生物 资源 的 编目 远 远 不 够 ,难以 提供 物 
种 多 样 性 的 信息 .物种 多 样 性 充满 活力 ,可 推动 世界 走向 一 个 可 持续 发 展 的 未 来 。 

本 项 任务 中 ,应 优先 考虑 以 下 几 个 方面 的 工作 : 

1. 调查 海洋 、 陆 地 和 淡水 生态 系统 ,获得 全 球 物种 多 样 性 的 综合 性 知识 ; 

2. 确定 这 些 物种 的 地 理 分 布 和 时 间 分 布 ; 

3. 发 现 、 描 述 和 编目 受 威胁 及 濒危 生态 系统 中 生存 的 物种 ; 

4. 把 了 解 最 少 的 生物 类 群 作 为 目标 ; 

5. 对 能 够 维持 全 世界 各 种 生态 系统 的 功能 及 完整 性 .促进 人 类 健康 .改善 人 类 食物 来 源 的 关键 类 
群 进行 编目 。 


全 球 物种 编目 的 作用 
1. 能 推动 物种 的 发 现 和 分 类 ,综合 有 关 物 种 的 信息 并 编 和 人 数据库 ,便于 快速 查询 。 


2. 能 获得 世界 上 很 多 生态 系统 内 物种 多 样 性 、 分 布 、 特 性 方面 的 信息 。 
3. 能 进行 本 底 评估 ,对 全 球 变化 进行 长 期 监测 和 分 析 。 
4. 能 发 现 新 的 生物 资源 。 
基于 科学 、 经 济 和 伦理 上 的 原因 ,我们 必须 阐述 和 了 解 物 种 多 样 性 的 重要 性 ,以 免 为 之 过 晚 .本 项 
任务 的 效益 远 远大 于 迎接 生物 多 样 性 危机 之 挑战 所 需要 的 投资 数额 .我 们 没有 比 这 更 大 的 科学 举措 ， 
也 没有 比 这 更 好 的 机 会 。 


第 二 项 任务 :分 析 这 个 全 球 发 现 计 划 获 得 的 信息 ， 
并 将 其 融合 于 一 个 能 反映 生命 史 的 预测 性 分 类 系统 


2000 年 系统 学 议程 的 第 一 项 研究 任务 包含 着 一 个 生物 多 样 性 最 基本 的 问题 :哪些 物种 与 我 们 共 
同 栖 上 县 地 球 ? 除 此 之 外 ,系统 学 家 还 有 另外 一 个 研究 目标 ,这 就 是 记录 物种 的 特性 ,综合 生物 学 其 他 领 
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各 种 生物 的 大 小 代表 其 主要 分 类 单元 已 描述 物种 的 数量 ， 
单位 尺寸 :Dj= 约 1 千 个 已 描述 的 种 


分 类 单元 

1 原核 生物 界 ( 细 菌 、 蓝 绿 淋 ) (水 母 .珊瑚 、 梢 子 母 ) 14 非 昆虫 节肢 动物 门 
2A 8 FG hl ( me & ) (8 HOH .甲壳 动物 等 ) 
3 RK 9 线形 动物 门 (线虫 ) 15 鱼 纲 ( 鱼 类 ) 

4 植物 界 (多 细胞 植物 ) 10 环节 动物 门 ( 虹 旭 等 ) 16 两 栖 岗 (两 栖 动物 ) 

5 原生 动物 门 11 软体 动物 门 ( 软 体 动物 ) 17 爬行 纲 ( 爬 行动 物 ) 
6 多 和 孔 动 物 门 (海绵 ) 12 RR Ath (i ZF) 18 f (4 #) 

7 腔 肠 动物 门 13 昆虫 纲 19 哺乳 类 (哺乳 动物 ) 


插图 :Frances L. Faweett, 4 #:Q. D. Wheeler, 1990, 美国 昆虫 学 会 年 刊 83:1031- 1047. 


物种 图 是 一 幅 想 象 的 景观 。 图 上 生物 的 大 小 与 其 代表 类 和 群 的 物种 数量 成 正比 。 这 些 数量 还 不 够 准确 ,许多 物种 尚未 被 发 现 或 描述 ,对 大 部 分 物种 的 系统 发 育 关 系 也 了 解 其 
少 。 例 如 昆虫 (甲虫 ) 以 迄今 描述 的 95 万 种 为 准 ,但 据 昆 虫 学 家 估计 可 能 有 1 千 万 种 以 上 。 图 中 涉及 的 其 他 类 群 如 爬行 动物 和 许多 无 脊 椎 动物 的 分 类 单元 ,可 能 未 按 其 自然 


类 群 组 合 , 也 就 是 说 它 门 可 能 不 具有 一 个 独特 的 共同 祖先 。 随 着 物种 的 描述 、 其 间 关系 的 穴 析 和 分 类 对 系统 发 育 的 反映 ,本 图 将 全 面 .形象 地 体现 生物 多 样 性 ， 


域 的 数据 ,并 为 解释 生物 学 信息 提出 一 个 理论 框架 .仅仅 具 备 一 份 物种 的 名 录 并 不 能 得 到 整理 所 掌握 
知识 的 一 个 预测 性 框架 。 永 续 利 用 地 球 的 生物 多 样 性 ,预测 的 准确 性 十 分 重要 .事实 上 ,系统 学 家 已 经 
掌握 了 一 套 整 理 生 物 多 样 性 知识 的 科学 依据 ,其 中 包括 通过 了 解 物种 间 血 缘 关 系 或 系统 发 育 关 系 而 
产生 的 分 类 系统 ( 见 专栏 9) 。 

现 生 物种 是 进化 多 样 化 慢 长 历史 的 最 终 产 物 . 进 化 史上 共同 祖先 和 相关 性 之 独特 模式 是 建立 物 
种 系统 发 育 的 基础 .按照 这 种 系统 发 育 遗 产 进行 的 分 类 称 为 自然 分 类 。 

物种 的 知识 是 按照 生物 系统 发 育 分 类 进行 整理 的 。 获 得 这 些 知识 能 使 科学 家 们 推断 有 特殊 科学 
价值 或 社会 价值 的 物种 及 其 特性 ,并 有 利于 创造 保存 这 些 知识 的 有 效 的 信息 系统 ( 见 专栏 10)。 这 些 知 
识 还 将 推动 新 的 多 学 科研 究 .按照 自然 分 类 的 理论 框架 储存 和 查询 信息 ,能 够 更 有 效 更 经 济 地 利用 物 
种 及 其 生境 的 知识 ( 见 专栏 11)。 


专栏 9 


系统 发 育 知识 使 基础 生物 学 与 应 用 生物 学 相 结 合 


分 析 系 统 发 育 关系 是 一 项 综合 性 的 工作 ,可 把 它 比 作 是 汇集 各 研究 领域 数据 的 一 个 总 成 .这 些 
研究 领域 包括 大 解剖 和 显 微 解剖 学 、 发 生生 物 学 、 遗 传 学 .分子 生 物 学 .比较 生理 学 .地质 学 .古生物 
学 .生态 学 行为 学 以 及 生物 地 理学 .一 项 研究 中 最 后 采用 的 数据 取决 于 所 研究 生物 的 种 类 、 与 这 些 
生物 有 关 的 知识 的 多 少 以 及 不 同类 型 的 数据 对 确定 种 间 关 系 所 起 作用 的 大 小 。 

系统 学 家 把 各 种 生物 特征 的 相似 性 归结 到 等 级 模式 之 中 ,以 反映 生物 的 系统 发 育 史 。 这 样 , 猫 类 


物种 具有 的 相似 性 在 能 类 物种 中 则 没有 ; 像 猫 类 和 能 类 的 食肉 动物 所 具备 的 相似 性 ,其 他 哺乳 动物 
中 也 不 存在 。 更 广泛 一 些 , 所 有 哺乳 动物 具有 的 特征 ,如 毛皮 和 乳腺 等 ,其 他 肴 椎 动物 都 没有 , 依 此 类 
推 , 直 到 包括 所 有 生命 类 群 .由 此 ,掌握 这 种 历史 等 级 使 系统 学 家 能 够 准确 地 预测 没有 仔细 研究 过 的 
物种 的 特征 。 这 种 推测 有 着 重大 的 经 济 意 义 。 从 鲜 为 人 知 的 物种 中 寻找 新 的 活性 药物 化 合 物 就 是 其 
中 一 例 ( 见 专栏 11)。 


自然 分 类 如 何 进行 预测 


正 像 物 种 特征 比较 研究 可 以 揭示 种 阅 进 化 关系 那样 ,进化 关系 也 可 用 所 谓 的 自然 分 类 清楚 地 表 
示 出 来 .物种 间 的 关系 划 有 等 级 ,其 分 类 也 是 如 此 。 这 种 关系 按照 十 八 世纪 瑞典 分 类 学 家 卡尔 * 林 奈 
的 姓名 命名 , 称 为 林 奈 等 级 ,包括 种 、 属 .科目 、 纲 . 门 和 界 . 照 此 分 类 ,所 有 哺乳 动物 都 属于 哺乳 纲 ， 
其 中 包括 食肉 目 。 食 肉 目 又 包括 能 类 和 猫 类 ,分 别 属于 驴 科 和 猫 科 。 猫 类 被 划分 在 猫 科 猫 属 Panthera 
( 注 : 仅 一 部 分 猫 类 划分 在 这 个 属 ) ,这 一 属 内 还 包括 虎 , 它 的 学 名 (拉丁 名 ) 为 Panthera tigris . 3X #£ Th 
特 的 名 称 好 比 一 种 科学 的 语言 ,不 仅 便于 交流 ,而且 也 便于 储存 任何 生物 类 群 的 信息 。 

由 此 可 想 而 知 ,按照 这 种 等 级 列 出 的 物种 名 单 比 按照 字母 顺序 列 出 的 名 单 更 能 预测 物种 的 特 
征 . 因 此 ,一 种 了 解 甚 少 的 猫 科 动 物 可 以 预测 它 具 备 其 他 猫 科 动物 的 许多 特征 、 食 肉 动 物 的 一 些 特 征 
和 所 有 哺乳 动物 的 部 分 特征 .按照 字母 顺序 列 出 的 名 单 ,或 没有 准确 反映 种 间 关 系 的 等 级 分 类 名 单 ， 
则 不 具备 这 种 推测 功能 。 

上 述 简单 事例 在 人 类 应 用 物种 知识 方面 具有 深远 的 意义 .假如 为 增强 对 物种 生物 学 特性 的 预测 
能 力 , 把 这 种 知识 聚集 在 数据 库 内 ,从 此 便 能 更 有 效 、 更 经 济 地 利用 这 些 特性 的 话 ,我 们 就 会 在 自然 
分 类 的 理论 框架 内 储存 和 查询 这 些 知 识 。 这 进一步 突出 了 发 现 所 有 物种 系统 发 育 关系 的 重要 性 。 


分 类 的 预测 价值 :紫杉醇 与 癌症 


天 然 产 品 紫杉醇 产 自 短 叶 紫 杉 (Tazrus brevifolia) 的 皮 , 经 证 实 是 一 种 治疗 卵巢 癌 和 乳腺 瘤 的 强 
效 药 剂 .遗憾 的 是 ,从 三 棵 树 的 皮 中 提取 的 紫杉醇 才能 治疗 一 位 瘤 症 患者 ,而 且 事后 树 便 死 亡 。 漫 无 
目的 地 去 寻找 含有 同样 产品 的 植物 可 能 会 花费 很 多 年 的 时 间 。 由 于 了 解 短 叶 紫 杉 的 进化 关系 ,人 们 
便 着 手 审查 它 的 近 缘 种 .研究 发 现 ,少量 浆果 紫 杉 (Tazrzus baccata) 的 叶 也 能 够 提取 紫杉醇 ,而 且 既 经 
济 又 不 会 给 紫 杉 树 带 来 危害 。 

更 有 趣 的 是 ,发 现 一 种 生活 在 短 叶 紫 杉 皮 中 的 真菌 新 种 Tazomyces azdzreanae: 它 也 能 产生 紫 杉 | 
醇 。 这 样 便 开 辟 了 生产 廉价 有 效 抗 瘤 药 的 可 能 性 。 


过 去 的 二 十 年 极 大 地 推动 了 系统 学 理论 和 实践 的 快速 发 展 ,使 揭示 地 球 生命 的 多 样 性 和 系统 发 
育成 为 一 个 可 以 实现 拘 目 标 。 电 子 显微镜 术 、 基 因 序列 分 析 等 新 的 数据 收集 方法 进一步 拓宽 了 信息 来 
源 , 反 过 来 ,信息 又 协助 人 类 把 物种 划 入 等 级 分 类 ,使 信息 本 身 成 为 所 有 比较 生物 学 领域 内 整理 物种 
多 样 性 知识 不 可 缺少 的 框架 。 新 型 计算 机 技术 能 够 进行 大 型 数据 库 的 处 理 , 和 否则 至 少 上 一 代 系 统 学 家 
会 被 埋没 在 大 量 的 数据 之 中 。 

本 项 任务 中 ,应 优先 考虑 以 下 几 个 方面 的 工作 : 

1. 确定 主要 生物 类 群 的 系统 发 育 关 系 ,为 基础 生物 学 和 应 用 生物 学 提出 一 个 总 体 理 论 框架 ; 

2. 发 现 对 应 用 生物 学 至 关 重 要 的 物种 类 群 的 系统 发 育 关 系 ,重点 放 在 对 人 类 健康 ,粮食 生产 、 全 
世界 各 种 生态 系统 保护 等 有 重要 作用 的 物种 上 

3. 发 现 对 基础 生物 科学 至 关 重 要 的 物种 类 群 的 系统 发 育 关 系 , 比 如 与 实验 科学 有 广泛 联系 的 学 
科 ,或 者 对 维持 生态 系统 功能 及 完整 性 必 不 可 少 的 学 科 ; 

4. 继续 探索 对 分 析 系 统 学 数据 更 有 效 的 技术 和 方法 。 

生命 系统 发 育 分 类 的 作用 有 : 
1. 建立 一 套 测 定 灭绝 速率 和 全 球 变化 模式 的 框架 ; 

2. 为 寻找 基因 、 生 物产 品 \. 生 物 防 治 因子 和 潜在 作物 物种 提供 指导 ; 
3. 为 生物 学 知识 的 管理 提供 一 套 预 测 性 框架 ,为 社会 和 科学 的 沟通 芮 定 基础 ; 
4. 协助 保护 者 .资源 管理 者 和 政策 制定 者 确定 优先 项 目 ; 
5 
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. 为 连结 所 有 生物 学 科 的 比较 研究 .连结 所 有 生物 类 群 的 多 学 科研 究 创造 基础 ; 
.为 了 解 形成 当今 生命 多 样 性 的 物种 形成 .灭绝 .适应 等 过 程 提供 科学 基础 。 


第 三 项 任务 :把 这 个 全 球 计 划 获 得 的 信息 整理 成 为 一 种 有 效 的 、. 可 查询 的 形式 ， 
以 最 大 限度 地 满足 科学 和 社会 的 需求 


掌握 世界 数 百 万 物种 的 大 量 知识 ,就 需要 新 型 的 配套 系统 的 支持 ,这 样 才 能 有 效 地 利用 和 查询 这 
些 知 识 . 这 种 信息 系统 包括 系统 学 ` 地 质 学 和 生态 学 方面 的 数据 ,其 来 源 途 径 主 要 是 现 有 自然 历史 标 
本 收藏 图 书馆 、 档 案 馆 以 及 不 断 发 展 着 的 调查 和 编目 。 随 着 新 种 的 发 现 . 系 统 发 育 关系 的 阐述 以 及 其 
他 信息 的 积累 ,有 关 物 种 的 知识 也 需要 不 断 更 新 .电子 知识 在 全 世界 的 普及 使 所 有 国家 都 受益 菲 浅 。 
数据 库 例如 分 子 遗传 学 数据 库 ,必须 通过 标准 的 物种 名 称 和 系统 发 育 分 类 与 其 他 生物 技术 数据 库 相 
连接 。 

系统 学 的 发 展 依靠 物种 信息 的 积累 和 交流 。 在 过 去 ,信息 是 通过 植物 志 、 动 物 志 、 专 著 ` 民 族 生物 
学 研究 等 文字 印刷 方式 进行 积累 和 传播 的 。 除 此 之 外 ,还 有 几 亿 个 标本 和 与 标本 有 关 的 数据 散 存 在 世 
界 各 地 的 系统 学 标本 存储 机 构 。 这 些 信息 必须 按照 科学 名 称 进 行 整理 ,同时 科学 名 称 要 遵循 以 种 间 关 
系 为 依据 的 等 级 分 类 。 

高 速 的 信息 处 理 技术 、 硬 件 以 及 建立 有 亲缘 关系 的 数据 库 等 现代 化 信息 手段 的 出 现 , 使 人 们 能 够 
为 任何 意图 .以 任意 组 合 方式 提取 物种 信息 。 在 综合 其 他 数据 库 内 的 信息 后 ,将 为 提出 地 球 生 命 组 合 

和 2 多 


新 的 见解 提供 依据 。 另 一 方面 ,以 上 的 数据 库 还 能 避免 研究 和 管理 的 重复 ,节省 数 百 万 美元 的 经 费 。 然 
而 ,由 于 各 种 来 源 的 欠缺 ,彻底 改革 系统 学 在 实际 应 用 上 的 作用 以 及 大 大 地 扩展 其 对 科学 和 社会 的 价 
值 的 理想 还 没有 实现 。 要 发 挥 散 落 在 世界 各 地 的 物种 信息 的 优势 ,就 应 当 开 展 这 项 工作 。 事 实 上 ,保护 
生物 学 家 、 资 源 管 理 者 及 其 他 自然 资源 利用 者 曾 多 次 要 求 获 得 这 些 信 息 。 

本 项 任务 中 ,应 优先 考虑 以 下 几 个 方面 的 工作 : 

1. 以 世界 自然 历史 标本 存储 机 构 收藏 的 标本 为 基础 ,建立 物种 信息 的 系统 学 \ 生 物 地 理学 和 生态 
学 数据 库 。 

2. 综合 系统 学 标本 存储 机 构 的 数据 和 地 理 信息 系统 (GIS) 数 据 库 的 信息 ,为 监测 过 去 和 现在 全 
球 变化 对 物种 的 分 布 和 灭绝 造成 的 影响 提供 条 件 。 

3. 建立 各 数据 库 间 的 联系 ,使 各 种 分 类 单元 及 其 分 布 区 所 有 有 用 的 信息 可 有 效 地 被 查询 。 

4. 建立 和 采用 一 套 信息 系统 ,便于 国际 用 户 的 使 用 。 

5. 编撰 所 有 系统 学 数据 库 必需 的 \ 包 括 分 类 名 称 ` 地 理 分 布 及 其 他 信息 内 容 的 数据 字典 。 

6. 出 版 手册 、 图 解 、. 电 子 动 植物 志 、 专 著 等 数据 产品 。 

7. 通过 持续 提供 软件 和 硬件 的 支持 ,以 建立 维持 和 更 新 数据 库 及 信息 网 络 的 机 制 。 


有 效 的 系统 学 信息 系统 的 作用 有 : 
” 工 .使 政策 制定 者 作出 更 全 面 的 资源 永 续 利用 决策 。 
2. 更 详细 地 记载 物种 的 灭绝 及 其 分 布 的 变化 。 
3. 系统 学 及 相关 信息 的 数据 库 使 用 效率 越 高 ,就 越 能 更 经 济 地 管理 生物 资源 。 


4. 方 便 系 统 学 知识 的 获得 ,便于 解决 问题 。 
5. 在 生物 学 及 其 他 领域 特别 是 生物 技术 的 数据 之 间 建 立新 的 比较 和 联系 的 方法 。 
6. 加 强国 际 交 流 与 合作 ,减少 科研 工作 的 重复 。 


迎接 挑战 :基础 设施 与 人 才 资源 


被 里 约 热 内 卢 召 开 的 联合 国 环境 与 发 展 大 会 以 及 生物 多 样 性 公约 采纳 的 全 球 行动 计划 (21 世 纪 
议程 ) 呼 吁 各 参 会 国 制定 国家 策略 ,去 编目 和 了 解 本 国 的 生物 多 样 性 ,并 制定 今后 的 保护 计划 。 在 编目 
和 了 解 世界 生物 多 样 性 的 过 程 中 ,国际 社会 将 面临 两 个 重大 的 挑战 .第 一 ,需要 极力 扩大 和 改善 系统 
学 研究 的 基础 设施 建设 ,特别 是 修 盖 生物 标本 收藏 馆 ; 第 二 ,强化 专业 系统 学 人 员 的 培训 和 录用 ,改变 
“分 类 学 障碍 ”的 说 法 。 
系统 学 为 生物 多 样 性 研究 商定 了 基础 

“许多 建议 (加 强 基 础 和 应 用 保护 研究 ) 认 为 , 现 有 分 类 学 知识 能 够 承担 这 些 工 作 。 然 而 ,完成 这 
项 工作 所 需要 的 训练 有 素 的 分 类 学 队伍 并 不 存在 .生物 多 样 性 的 描述 .编目 分 类 ,监察 和 管理 知识 
必须 经 过 培训 .有 了 以 上 这 些 基础 才能 去 研究 和 保护 生物 多 样 性 。” 
国家 研究 委员 会 ,保护 生物 多 样 性 ,1992, 第 71 页 

系统 学 界 通过 2000 年 系统 学 议程 ?提出 系统 学 行动 计划 的 建议 .上 面 提 到 的 三 项 任务 的 成 功 , 对 
履行 这 个 行动 计划 是 必要 的 。 这 项 计划 有 以 下 几 个 主要 点 : 

1. 所 有 的 国家 为 了 解 、 保 存 和 利用 他 们 的 生物 多 样 性 就 要 建立 和 加 强 具 标本 收藏 馆 的 系统 学 研 
究 中 心 ; 

2. 对 系统 学 家 和 其 支撑 系统 工作 人 员 进 行 教育 和 培训 的 有 关 单 位 进行 资助 ; 

3. 在 基础 和 应 用 系统 学 范围 内 要 扩大 研究 工作 的 队伍 ; 

A. 全 世界 系统 学 研究 单位 之 间 在 研究 和 教育 方面 开展 国际 合作 和 交流 ; 

5. 在 上 述 这 些 单 位 之 间 ,并 扩大 到 社会 上 建立 起 电子 交流 的 联系 ; 

6. 支持 基于 分 类 单元 和 全 世界 范围 的 比较 系统 学 研究 。 


se 


建立 和 加 强 系 统 学 研究 中 心 及 标本 收藏 


在 一 些 国家 中 没有 合适 的 基础 设施 来 存放 世界 上 大 多 数 国家 的 生物 多 样 性 标本 ,是 得 不 到 生物 
多 样 性 综合 知识 的 一 个 原因 。 同 时 ,发 达 国 家 的 系统 学 研究 中 心 也 不 是 以 支持 它们 为 执行 上 述 研 究 任 
务 所 承担 的 应 负 的 责任 。 物 种 丰富 国家 未 来 的 繁荣 将 有 赖 于 发 展 管理 他 们 自己 的 生物 资源 的 能 力 ,其 
中 包括 要 具备 为 提供 对 有 效 地 作出 决策 所 需 知 识 的 科学 基础 设施 .世界 各 国 为 克服 科学 能 力 的 不 足 ， 
就 必须 通过 建造 新 的 或 加 强 现 有 标本 收藏 馆 的 基础 设施 ,例如 博物 馆 、 标 本 馆 和 为 微生物 和 遗传 资源 
保存 所 需要 的 贮藏 所 。 

全 世界 自然 历史 标本 收藏 馆 拥 有 20 亿 号 标本 (Duckworth 等 ,1993) 。 我 们 虽然 已 掌握 有 如 此 巨大 
的 生物 学 遗产 ,但 是 通过 已 保存 的 标本 ,只 鉴定 了 地 球 物 种 多 样 性 的 一 小 部 分 .植物 、 动物 和 其 它 生 物 
的 系统 学 标本 收藏 馆 仅仅 是 我 们 生物 区 系 的 永久 性 记录 。 起 源 于 这 些 标 本 收藏 馆 的 特殊 的 库 和 数据 
库 是 我 们 对 地 球 自然 历史 的 书面 的 记录 ( 见 专栏 12)。 已 保存 标本 的 系统 学 收藏 馆 可 在 自然 历史 博物 
馆 、 标 本 馆 和 大 学 的 标本 馆 和 农业 部 .自然 资源 或 生物 考察 等 政府 有 关 部 门 的 标本 馆 内 见 到 。 这 些 标 
本 收藏 馆 也 可 以 活 生 物 的 形式 保存 在 动物 园 、. 水 族 馆 .昆虫 馆 、 乌 类 馆 、 植 物 园 内 ,或 者 如 种 质 、 冷 冻 的 
组 织 和 微生物 的 模式 标本 保存 在 特殊 的 贮藏 器 内 。 

有 保存 标本 的 标本 收藏 ( 馆 ) 的 系统 学 研究 中 心 馆 是 各 国 乃 至 全 世界 有 关 生 物 多 样 性 知识 的 贮藏 
场所 .尽管 各 国标 本 收藏 的 基础 设施 不 同 , 但 它们 基本 上 具有 两 种 主要 功能 。 第 一 种 是 国家 研究 中 心 ， 
通过 标本 馆 、 图 书馆 和 数据 库 , 记 载 本 国 的 生物 多 样 性 。 第 二 种 设施 也 很 有 存在 的 必要 ,这 类 中 心 的 功 
能 是 支持 重点 放 在 分 类 单元 , 且 有 国际 意义 的 系统 学 研究 或 标本 收藏 .有 些 中 心 只 有 上 述 一 种 功能 ， 
而 另外 一 些 中心 则 具有 足够 的 基础 设施 和 科研 力量 ,两 种 功能 兼备 .许多 中 心 可 以 在 现 有 机 构 和 标本 
收藏 馆 的 基础 上 建立 ,而 有 些 则 必须 重新 建立 。 不 论 是 那 种 情况 ,科学 设施 的 核心 都 应 当 包 括 有 分 类 
单元 知识 的 专业 系统 学 家 。 


系统 学 标本 收藏 馆 的 重要 性 


“科学 标本 收藏 馆 是 社会 在 了 解 自然 界 过 程 中 的 一 项 持续 性 投资 .… ……'. 随 着 生境 的 消失 、 物 种 
的 灭绝 和 有 重要 地 质 学 及 古生物 学 价值 的 遗址 的 破坏 ,这 些 标本 收藏 迄 中 的 标本 已 成 为 一 种 不 可 再 
EUR.” 


一 保存 自然 科学 标本 收藏 馆 :环境 遗产 记事 ,第 6 页 
1. 标本 收藏 馆 是 人 类 自然 遗产 的 永久 性 记录 , 它 包 含 着 许多 科学 领域 的 研究 所 不 可 缺少 的 材 
料 ,例如 保存 生物 多 样 性 和 监测 全 球 变化 的 研究 ; 
2. 标本 收藏 馆 能 满足 应 用 生物 学 的 需求 ,例如 卫生 科学 (寄生 虫 学 .流行 病 学 .诊断 学 ) PL 
源 管理 ` 生 物 技 术 等 ; 
3. 标本 收藏 馆 积 极 支 持 公 共 教 育 和 正规 教育 计划 ; 
4. 通 过 标本 收藏 馆 的 展览 提高 自然 保护 及 生物 多 样 性 保护 的 公众 意识 。 
国家 系统 学 研究 中 心 。 国 家 研究 中 心 应 当 建 有 收藏 各 地 方 或 各 地 区 动 植物 区 系 的 标本 收藏 馆 ,使 
国内 生物 多 样 性 研究 和 管理 能 够 采用 准确 .最 新 的 系统 学 数据 。 世 界 各 地 的 标本 收藏 馆 要 求 配 有 专业 
人 员 ,以 便 提 供 当 地 生物 区 系 鉴 定 准 确 的 标本 ;这 些 标本 许多 都 是 当地 的 特有 种 .此 外 ,全 国生 物 学 调 
查 所 得 数据 的 核实 也 要 依靠 这 些 系 统 学 标本 收藏 馆 中 的 佐证 标本 。 只 有 研究 这 些 标本 ,研究 人 员 才 能 
断定 同一 物种 在 不 同 地 区 被 发 现 。 
国家 生物 资源 研究 中 心 的 迅速 发 展 以 及 世界 各 国 制 定 的 各 种 计划 ,如 墨西哥 的 全 国生 物 多 样 性 
交流 委员 会 (CONABIO)、 哥斯达黎加 的 国家 生物 多 样 性 研究 所 (INBio) .美国 的 全 国生 物 多 样 性 调查 
等 ,都 为 此 类 项 目 在 国内 的 顺利 开展 商定 了 基础 .这些 计划 作用 重大 ,是 研究 .管理 和 保护 各 国生 物 多 
样 性 的 基础 ,也 是 争取 国内 支持 这 些 行 动 的 依据 。 
国际 系统 学 研究 中 心 .2000 年 系统 学 议程 行动 计划 的 内 容 之 一 就 是 建立 新 的 或 完善 现 有 的 系统 
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学 研究 中 心 ,为 实现 记录 世界 生物 多 样 性 这 个 目标 作出 贡献 .各 个 国家 研究 中 心 重 复 各 种 生物 类 和 群 的 
标本 收藏 馆 或 分 类 研究 既 不 现实 ,也 没有 必要 。 相 反 , 了解 世界 上 某 一 分 类 单元 情况 的 系统 学 家 则 必 
须 得 到 收藏 各 国标 本 的 研究 中 心 的 资助 ,以便 在 世界 各 地 开展 研究 工作 ,因为 物种 往往 经 常 是 跨国 境 
分 布 的 .系统 学 研究 最 终 以 分 类 单元 来 定向 的 ,所 以 就 必须 全 面 地 在 世界 范围 内 收藏 各 种 生物 类 群 的 
标本 。 由 于 地 区 性 标本 收藏 一 般 不 够 全 面 , 很 难 广泛 地 满足 比较 系统 学 研究 的 要 求 , 各 国 研 究 机 构 有 
必要 充分 地 参与 。 由 此 ,国际 研究 机 构 间 的 合作 和 数据 库 联网 不 可 缺少 。 物 种 丰富 国家 研究 机 构 间 的 
伙伴 关系 也 应 当 建 立 起 来 ,以 便 保 持 系统 学 标本 收藏 馆 的 稳定 和 发 展 , 建 立 起 交流 标本 .生物 多 样 性 
信息 、 培 训 水 平和 科学 知识 的 网 络 。 任 何 一 个 标本 收藏 馆 都 不 可 能 有 研究 各 种 生物 类 群 的 系统 学 家 ， 
可 见 各 类 群 世 界 级 专家 的 人 员 交 流 也 势 在 必 行 .系统 学 界 如 果 想 多 快 好 省 地 编目 和 划分 世界 的 物种 
多 样 性 ,建立 起 这 种 联系 妃 关键 所 在 。 

在 各 有 关 国 家 建立 系统 学 研究 中 心 , 就 要 求 开展 一 些 重大 的 国际 合作 项 目 。 除 个 别 情况 外 ,世界 
上 物种 丰富 国家 基本 上 没有 标本 收藏 馆 , 即 使 有 也 得 不 到 足够 的 支持 .这 些 标本 收藏 馆 大 部 分 都 缺乏 
专业 系统 学 家 和 受过 培训 的 辅助 人 员 ,可 用 于 调查 和 编目 的 经 费 也 普遍 不 足 , 更 不 用 说 资助 系统 学 家 
到 世界 各 地 的 标本 收藏 馆 去 进行 必要 的 比较 研究 .物种 丰富 的 国家 如 果 要 建立 一 套 系统 学 知识 体系 ， 
为 生物 多 样 性 的 保护 和 永 续 利 用 提供 服务 ,就 必须 解决 这 些 问题 ( 见 专栏 13) 。 
在 发 达 国 家 ,系统 学 标本 收藏 馆 的 数量 和 侧重 各 不 相同 。 以 美国 为 例 , 主 要 的 系统 学 研究 中 心目 
前 有 50 多 个 ,收藏 从 细菌 到 鲸 几 症 包括 所 有 生命 类 型 的 标本 .大 型 标本 收藏 中 心 都 是 一 些 重要 的 自然 
历史 博物 馆 及 植物 园 ,州立 机 构 、 联 邦 机 构 . 许 多 大 学 也 有 .此 外 ， 侧重 收藏 地 区 标本 的 研究 机 构 也 很 
多 ,这 些 标 本 收藏 馆 具有 重要 的 历史 和 科学 价值 。 


与 系统 学 标本 收藏 馆 有 关 的 数据 中 心 `. 图 书馆 和 档案 馆 同样 是 系统 生物 学 研究 的 重要 场所 。 专 业 
图 书馆 并 不 仅 限 于 收藏 书刊 ,也 同样 收集 卡片 索引 、 目 录 、 原 稿 、 插 图 .照片 缩微 胶片 记录 、 制 图 法 资 
料 、 文 献 档案 及 不 同类 型 的 电子 媒介 物 等 。. 近 几 年 来 ,科学 信息 的 大 量 产生 也 相应 使 大 多 数 研 究 机 构 
的 收集 能 力 有 所 提高 。 如 果 生 物 多 样 性 的 全 球 调查 和 编目 工作 获得 成 功 , 即 使 是 最 大 的 研究 中 心 , 其 
贮存 和 管理 信息 的 能 力也 会 逐渐 显得 不 足 。 只 有 加 强 基 础 设施 建设 ,提高 系统 学 数据 库 的 储存 、 查 询 
和 利用 的 水 平 , 才 能 使 世界 科学 家 共享 信息 ,避免 研究 重复 和 面向 社会 。 


利用 收藏 标本 解决 问题 


1. 当 公 共 健 康 官员 担心 鱼 类 体内 的 水 银 含量 时 ， aL HR ee EE th TE TS 
模式 。 

2. GFE RYE 2 FE RAF 2 9 A A 
研究 人 员 联 想到 由 于 环境 中 存在 有 DDT. 

3. 导致 爱滋病 及 其 他 疾病 的 病毒 突变 频繁 , 知 与 前 曾 描述 过 的 .贮藏 在 模式 菌 种 或 冷冻 标本 中 
的 菌株 进行 比较 , 便 可 帮助 公共 健康 官员 了 解 疾 病 的 传播 途径 。 


改善 系统 学 基础 设施 的 建议 : 


1. 建立 和 完善 世界 各 国 的 国家 系统 学 研究 中 心 。 这 些 中 心 应 当 盖 有 收藏 记录 国内 生物 财富 的 地 
方 及 地 区 参考 标本 收藏 馆 , 具 有 供 研究 和 储存 信息 之 用 的 设施 ,并 具备 培训 和 教育 能 力 ; 

2. 建立 或 完善 国际 系统 学 研究 中 心 ,以 利于 获得 系统 学 知识 和 建设 有 分 类 单元 研究 重点 的 世界 
性 标本 收藏 馆 ; 

3. 通过 建立 国际 网 络 ,改善 世界 上 标本 的 照管 和 保藏 ,实现 知识 、 信息 及 资源 的 共享 。 

4. 加 强 和 扩大 现 有 系统 学 研究 中 心 的 储存 能 力 及 研究 力量 ,包括 制定 相应 计划 ,将 所 有 已 登记 
的 生物 多 样 性 录 和 人 数据库。 

5. 加强 和 扩大 系统 学 研究 中 心间 国际 合作 项 目 进行 。 
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教育 .培训 及 人 才 资源 开发 


在 占 世 界 80 色 的 陆 生 生物 多 样 性 的 国家 中 ,其 科学 家 数量 仅 占 6%% ,这 是 获得 科学 知识 了解 和 有 
效 利用 生物 多 样 性 的 一 个 严重 制约 。 除 此 之 外 , 另 一 个 制约 因素 是 全 世界 缺少 许多 生物 类 群 的 分 类 专 
家 ,包括 一 些 最 富有 多 样 性 和 最 有 经 济 价值 的 类 群 . 由 此 看 来 ,实现 2000 年 系统 学 议程 提出 的 三 项 研 
究 任 务 所 面临 的 最 大 挑战 ,或 许 就 是 在 全 世界 招募 、 教 育 、 培 训 和 聘用 足够 的 系统 学 家 和 技术 人 员 。 美 
国 国家 科学 理事 会 的 全 球 生 物 多 样 性 特别 工作 组 (1989)、 英 国 上 议院 的 科学 和 技术 选择 委员 会 
〈《1991) 等 众多 组 织 和 特别 工作 组 的 结论 认为 ,缺少 生物 的 鉴定 .记录 和 分 类 方面 的 系统 生物 学 家 , 严 
重 妨 碍 了 全 球 生 物 多 样 性 减少 之 问题 的 有 效 解决 。 

训练 有 素 的 系统 学 家 数量 减少 的 原因 很 多 。 美 国 国家 科学 基金 会 近期 指导 进行 的 一 项 大 学 调查 
发 现 , 在 调查 的 有 博士 学 位 授予 权 的 院 校 中 ,系统 生物 学 家 仅 有 940 名 ,25%% 的 所 有 调查 院 校 只 设置 了 
副手 职位 (Higher Education Survey，1990) 。 更 可 悲 的 是 , 收 到 的 回复 中 只 有 18%% 的 院 校 表明 如 果 今 
后 有 新 的 教员 职位 ,它们 才 会 聘用 系统 学 家 。 在 美国 和 英国 ,系统 学 家 的 研究 工作 和 (或 ) 教 学 职位 由 
于 受到 其 他 生物 学 领域 的 竞争 ,在 几 十 年 前 已 紧缩 .因此 ,大 部 分 研究 机 构 在 调查 时 提出 它们 愿 扩大 
的 是 分 子 生 物 学 而 不 是 系统 学 项 目 , 因 为 前 者 "具有 更 大 的 资助 机 会 ”。 

出 于 上 述 原因 ,新 培养 的 系统 学 家 的 数量 比 二 十 年 前 减少 了 很 多 。 许 多 生物 类 群 的 分 类 专家 越 来 
越 少 , 如 藻类 、 细 菌 、 真菌、 低 等 无 脊 椎 动物 `. 昆虫 及 其 近 缘 种 等 .一 些 对 经 济 和 生态 系统 最 为 重要 的 生 
物 类 群 更 需要 专业 培训 的 专家 去 作 研 究 .以 线虫 为 例 , 美 国有 15 个 机 构 所 属 的 标本 馆 和 12 名 专职 线虫 
系统 学 家 ,但 带 学 生 的 线虫 系统 学 家 只 有 两 位 。 由 于 线虫 对 农业 有 举足轻重 的 作用 ,缺乏 受过 培训 的 
专家 必 将 会 带 来 严重 的 经 济 后 果 。 
改变 “分 类 学 障碍 ”的 说 法 

过 去 几 年 中 下 降 最 严重 的 是 分 类 学 和 系统 学 领域 .受过 培训 的 分 类 学 家 急 缺 ,热带 国家 | . 
几乎 没有 .许多 重要 生物 类 群 方面 的 专家 也 显 不 足 , 发 达 国 家 甚至 也 是 如 此 。 另 外 ,可 参考 的 标本 收 


藏 馆 也 不 够 ,而 且 地 区 分 布 不 平衡 ,大 都 远离 被 研究 生物 的 原 产 地 。 目 前 分 类 学 的 效率 低下 ,重复 研 
究 较 多 .有 鉴于 此 ,在 开展 任何 生物 多 样 性 研究 之 前 ,必须 首先 强调 改变 “分 类 学 障碍 ”的 说 法 。 
—DIVERSITAS: IUBS-IUMS-SCOPE-UNESCO 


生物 多 样 性 项 目 


尽管 人 们 对 许多 类 群 的 系统 学 知识 不 足 或 严重 不 足 有 一 致 的 看 法 ,但 尚 从 缺 能 说 明 该 学 科 有 这 
种 趋势 的 证 据 。 统 计 世 界 现 有 的 各 生物 类 和 群 的 系统 学 专业 人 才 十 分 必要 ,只 有 这 样 ,才能 更 准确 .更 有 
效 地 重点 实施 培训 和 吸收 人 才 计划 。 

系统 生物 学 人 才 资 源 的 匮乏 在 发 展 中 国家 更 为 突出 。 受 过 培训 的 科学 家 的 人 数 、 研 究 经 费 、 标 本 
馆 职位 .部门 支持 等 方面 的 不 足 , 都 意味 着 很 少 有 系统 科学 家 投身 这 一 学 科 行 列 。 要 扭转 这 种 局 势 , 迫 
切 需要 强化 发 展 中 国家 地 方 自然 历史 研究 机 构 的 作用 ,建立 与 发 达 国 家 研究 机 构 间 的 联系 (National 
Research Council) 。 由 于 在 很 多 发 展 中 国家 环境 恶化 和 生物 多 样 性 丧失 的 趋势 不 断 加 快 ,培训 “ 准 分 类 


学 家 ”, 让 他 们 与 专业 系统 学 家 一 道 工作 也 不 失 为 解决 人 才 资 源 问题 的 一 种 办 法 ,但 这 并 不 意 谓 着 可 


以 取代 建立 有 效 的 科学 基础 设施 和 强大 的 科学 家 队伍 的 计划 。 

在 发 达 国 家 ,不 少 像 博物 馆 和 植物 园 之 类 的 研究 机 构 开 展 了 与 附近 大 学 联合 培养 系统 生物 学 本 
科 生 和 研究 生 的 项 目 。 这 些 项 目 一 般 说 来 都 有 很 大 的 国际 性 成 分 .尽管 取得 的 成 绩 不 少 ,但 就 物种 多 
样 性 的 危机 程度 和 描述 世界 生物 资源 在 科学 和 经 济 上 的 紧迫 性 来 看 ,系统 学 还 必须 得 到 更 多 的 经 费 
支持 ,争取 在 研究 生 和 大 学 生 中 培养 出 更 多 的 科学 家 。 部 分 证 据 表 明 ,大 学 生 对 物种 多 样 性 很 感 兴趣 ， 
他 们 为 现代 系统 学 研究 的 重要 性 和 在 智力 上 富有 的 挑战 性 所 吸引 .但 由 于 研究 生 经 费 不 足 和 博士 生 
毕业 后 就 业 前 景 渺茫 ,他们 只 好 打消 投身 系统 学 研究 的 念头 。 


加 强人 才 资 源 的 利用 的 建议 : 

1. 从 事 发 展 中 国家 持续 发 展 和 环境 保护 推动 项 目的 国际 机 构 应 当 为 基础 系统 学 研究 以 及 专业 、 
准 专业 系统 学 家 的 培训 和 聘任 提供 经 费 支 持 ; 

2. 各 国 应 当 建立 全 国生 物 多 样 性 监测 机 构 、 系 统 学 研究 中 心 及 标本 收藏 馆 及 国家 生物 普查 机 
构 ,并 为 上 述 活动 的 开展 配置 专业 的 系统 学 家 ; 

3. 各 大 学 和 研究 所 凡 设 有 生物 多 样 性 培训 和 教育 项 目 者 ,应 当 配备 专业 系统 学 教师 

4. 发 达 国 家 的 政府 机 构 和 自然 历史 研究 机 构 应 当 向 物种 丰富 国家 的 学 生 及 其 他 科研 人 员 的 培 
训 提供 更 大 的 援助 ; 
5. 资 源 管理 机 构 ( 如 林业 、 渔 业 、 野 生动 物 等 ) 的 工作 人 员 中 应 当 包括 专业 系统 学 家 。 


2000 年 系统 学 议程 完善 了 其 他 生物 多 样 性 计划 


国际 社会 中 许多 机 构 和 组 织 已 经 认识 到 描述 和 了 解 地 球 物 种 多 样 性 的 紧迫 性 .这 些 机 构 和 组 织 
包括 : 

“联合 国 环境 与 发 展 大 会 (UNCED) 及 其 二 十 一 世纪 议程 

“联合 国 环境 规划 署 CUNEP) 

SKA BAS (UNDP) 

“Diversitas ,一 个 包括 以 下 机 构 和 组 织 的 联合 体 : 

国际 生物 科学 联盟 (CIUBS) 

环境 问题 科学 委员 会 (SCOPE) 

联合 国教 科 文 组 织 C(UNESCO) 

国际 微生物 学 联盟 (IUMS) 

“二 十 一 世纪 的 微生物 多 样 性 ,国际 生物 科学 联盟 (CIUBS) 和 国际 微生物 学 联盟 (IUMS) 的 一 项 行 
动 计 划 

非 政府 组 织 也 发 出 同样 的 呼吁 ,特别 是 : 

“世界 资源 研究 所 (WRI) 

“世界 自然 基金 会 (WWFE) 

“国际 自然 保护 联盟 /国际 自然 与 自然 资源 保护 联盟 (IUCN) 

“大 自然 保护 协会 CTNC) 

2000 年 系统 学 议程 从 分 类 单元 着 手提 出 了 全 球 生 物 多 样 性 的 一 个 前 景 展望 ,给 保护 和 管理 这 项 
必 不 可 少 资源 的 科学 框架 增添 了 新 的 内 容 。. 对 所 有 旨 在 了 解 、 保 护 和 利用 生物 多 样 性 的 计划 ,如 生态 
学 界 提出 的 持续 性 生物 圈 计 划 来 说 ,2000 年 系统 学 议程 起 到 了 锦上添花 的 作用 。 


， 对 2000 年 系统 学 议程 的 投资 


2000 年 系统 学 议程 之 计划 设想 宏伟 ,需要 众多 方面 的 大 力 支持 才能 得 以 实现 .任何 政 府 或 任何 国 
际 机 构 都 不 可 能 去 单独 资助 这 项 计划 的 运作 , 它 需 要 世界 上 众多 组 织 和 政府 的 共同 支持 。2000 年 系统 
学 议程 的 任务 通过 一 项 长 远 的 25 年 计划 实现 ,每 年 大 约 需要 投入 经 费 30 亿 美元 。 

经 费 预 算 系 根据 各 项 工作 的 开支 制订 ,其 中 包括 人 才 开 发 .建立 计算 机 网 络 、 支 持 标本 收藏 建设 
(包括 模式 菌 种 及 种 质 贮藏 所 )、 研 究 项 目 、 宣 传 研究 成 果 等 方面 的 开支 .按照 目前 的 资助 水 平 , 完 成 
2000 年 系统 学 议程 的 任务 至 少 需要 150 年 .鉴于 生物 多 样 性 丧失 的 紧迫 性 ,目前 每 年 的 研究 和 基础 建 
设 资助 (大 约 5 亿 美元 ) 必 须 增 加 将 近 六 倍 才能 在 25 年 内 完成 这 些 任 务 。 

从 生物 多 样 性 显示 出 的 科学 、 经 济 和 美学 价值 中 不 难看 出 这 项 投资 的 产 出 。 发 现 、 描 述 . 了 解 和 利 
用 其 他 物种 取得 的 持续 进展 已 经 使 人 类 受益 上 罪 浅 。 人 类 今天 的 进一步 努力 会 带 来 明天 的 更 大 效益 , 同 
时 也 将 有 助 于 今后 世 世 代 代 生命 多 样 性 的 保存 。 
ee 
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生物 多 样 性 (Biodiversity) :生物 的 多 样 性 和 变异 性 ,包括 物种 的 数量 .独特 分 支 Cdistinct clades) 的 数 
量 、 种 内 遗传 性 变异 及 “功能 的 2 多样 性 (生物 的 功能 .生物 与 其 他 生物 及 其 环境 间 相 互 作 用 的 多 得 不 
计 其 数 的 方式 )。 
生物 地 理学 (Biogeography) :对 植物 .动物 和 微生物 地 理 分 布 的 研究 。 
生物 资源 (Biological Resource,Bioresources) :对 人 类 有 实在 或 潜在 价值 的 某 种 生物 ,或 者 源 于 某 种 生 
物 的 产品 。 | 
4 4 Fl (Biosphere) :有 生命 存在 的 地 球 部 分 。- 
生物 技术 (Biotechnology) :利用 生物 或 源 于 生物 的 物质 ,去 制造 或 改变 某 种 产品 ,改良 植物 或 动物 ,或 
者 为 特定 目的 去 开发 微生物 的 任何 技术 。 
分 支 (Clade) : 某 一 分 类 单元 ,系统 发 育 中 的 一 个 分 枝 或 一 个 谱系 。 
分 类 (Classification)# 正 式 地 、 科 学 地 把 物种 排列 到 某 种 等 级 系统 ,并 给 物种 或 物种 类 群 制订 科学 名 
称 。 
比较 生物 学 (Comparative biology) :一 个 以 上 物种 之 间 的 比较 研究 。 
特有 (Endemic) : 某 种 生境 或 地 理 区 域 特 有 的 某 一 物种 。 
44% (Extinction) : 某 一 物种 最 后 一 个 个 体 的 死亡 。 
编目 (Inventory) :把 某 一 指定 区 域 的 所 有 植物 .动物 及 微生物 种 的 名 称 或 描述 编列 成 表 。 
& ZB (Monograph) :汇集 世界 上 关于 某 一 分 类 单元 的 所 有 已 知 资料 ,包括 新 的 及 过 去 已 知 的 物种 , 按 
照 已 知 的 系统 发 育 组 织 编写 的 一 本 全 面 的 论著 。 
系统 发 育 多 样 性 (Phylogenetic diversity) : 某 一 类 群 所 代表 的 独特 的 谱系 的 数量 或 分 支 的 数量 。 
系统 发 育 (Phylogeny) :物种 间 进 化 中 的 模式 及 物种 间 的 共同 祖先 。 
物种 (Species) :生物 的 种 类 ;分 类 学 和 系统 发 育 分 析 的 基本 单位 。 
物种 多 样 性 (Species diversity) : 原 义 是 指 即 地 球 上 物种 的 数量 和 种 类 ;广义 上 亦 包括 物种 的 数量 及 其 
相互 关系 (如 系统 发 育 多 样 性 ) 。 
调查 (Survey) :按照 一 定 的 方法 考察 某 一 选 定 地 区 ,以 便 发 现 大 型 或 微型 的 动 植 物 区 系 内 的 所 有 物 
种 。 
系统 学 (Systematics) :现在 生活 的 和 化 石生 物 ( 物 种 ) 种 类 的 比较 研究 ,包括 它们 的 描述 、 分 布 及 其 共 
存 的 系统 发 育 关 系 。 
分 类 单元 (Taxon) :一 个 物种 或 一 组 相关 的 物种 。 
分 类 学 (Taxonomy) :把 物种 科学 地 划分 到 一 种 等 级 系统 ,以 此 反映 对 其 系统 发 育 的 了 解 情况 。 
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